GWAS -da nisbət nisbəti ilə insidans nisbəti nisbətini fərqləndirməyin əhəmiyyəti

Son illərdə genom geniş assosiasiya tədqiqatları ardıcıl olaraq ümumi kompleks xəstəliklərlə əlaqəli olan bir çox genetik variantı təsbit etdi, lakin bu risk allelləri ilə izah edilən irsiyyət miqdarı hələ də aşağıdır. Eksik irsiyyətin bir hissəsi genetik heterojenliyə və kiçik nümunə ölçülərinə görə ola bilər, lakin bir çox genom geniş assosiasiya tədqiqatında optimal olmayan tədqiqat dizaynları da xəstəliyə meylli olan gen variantlarının müəyyən edilməməsinə səbəb ola bilər. Klassik bir vəziyyətə nəzarət işindən normal istifadə edilən nisbət nisbəti, genotiplə xəstə olma arasındakı əlaqəni ölçür . Müqayisə üçün, insidensiya sıxlığı nümunəsi altında, insidans nisbəti genotip ilə olma arasındakı əlaqəni ölçürxəstə. Maraqlı xəstəliyi istisna edən hadisələrin olması halında, nisbət nisbəti ilə insidans nisbəti arasındakı fərqləri təxmin edirik. Bu cür hadisələr pleiotropiya səbəbiylə meydana gələ bilər və yarışan hadisələr olaraq bilinir. Bundan əlavə, bu fərqlərin assosiasiya testinə necə təsir etdiyini araşdırırıq.

Metodlar

Gen variantları rəqabətli hadisələrə məruz qalan fərdlərin ömrünü simulyasiya edirik. Genotip və xəstəlik arasındakı əlaqəni qiymətləndirmək üçün, klassik vəziyyətə nəzarət işləri və insidans sıxlığı nümunəsi tətbiq etdik.

Nəticələr

Gen variantının rəqabət hadisələri ilə əlaqəli ola biləcəyi faktı, məsələn, ömür boyu nəzərə alınmadığı zaman, nisbət nisbəti ilə insidensiya nisbəti arasında əhəmiyyətli ədədi fərqlər tapırıq. Çox az və ya heç bir fərq göstərməyən yeganə ssenari, nadir bir xəstəliklə əlaqəli olmaqdır və başqa heç bir əlaqəsi yoxdur. Bundan əlavə, assosiasiya testləri üçün p dəyərlərinin iki iş dizaynı arasında fərqləndiyini görürük.

Nəticələr

Maraq xəstəliyin etiologiyasındadırsa, insidans sıxlığı nümunəsinə əsaslanan bir dizayn, təxminin üstünlük verilən şərhini təmin edir. Klassik bir vəziyyət nəzarəti dizaynı altında və rəqabətli hadisələrin olması halında, assosiasiya testində p dəyərlərinin dəyişməsi yanlış pozitiv nəticələrə və daha da əhəmiyyətlisi yalan mənfi tapıntılara səbəb ola bilər. SNP -lərin p -dəyərlərinə görə sıralanması iki tədqiqat dizaynı arasında fərqlənə bilər.

Əlavə elektron material

Bu məqalənin onlayn versiyası (doi: 10.1186/s12881-015-0210-1) səlahiyyətli istifadəçilər üçün əlçatan olan əlavə materiallardan ibarətdir.

Fon

Genom geniş assosiasiya tədqiqatı (GWAS), genetik varyasyonu xəstəliklə əlaqələndirmək üçün güclü bir vasitədir və minlərlə assosiasiya quruldu və təkrarlandı [1]. Yeni metodologiyanın inkişafı sayəsində GWAS -ın nəticələri digər parametrlərdə faydalı olmuşdur. Bir nümunə sağlamlıqla əlaqəli epidemioloji araşdırmalardır (məsələn, Ligthart et al. [2] və Simonson et al [3]). Burada, GWAS -dan təxmin edilən nisbət nisbəti, poligenik skor vasitəsilə genetik dəyişkənlik üçün bir vəkil olaraq istifadə edildi [4, 5]. Oran nisbətinin təxmin edilən dəyəri çox vaxt bir -biri ilə əlaqəli olmayan bir çox hadisəyə və nəzarətə əsaslanır və genetik dəyişkənlik ilə xəstəliyin yayılması arasındakı əlaqəni qiymətləndirir.

Bununla birlikdə, maraq xəstəliyini istisna edən hadisələr, GWAS üçün hallar və nəzarət nümunələri seçərkən arzuolunmaz və həlledici rol oynaya bilər. Genotipli SNP -lərdən bəziləri bir xəstəliklə əlaqəli olsa da, məsələn, erkən ölümü istisna edən digər hadisələrlə əlaqəli olarsa, xəstəliyin etiologiyası ilə əsl əlaqələri müəyyən etmək üçün diqqətlə seçilmiş bir iş dizaynına ehtiyac vardır. Qarşılaşan hadisələr pleiotropiya səbəbiylə meydana gələ bilər və tez -tez yarışan hadisələr olaraq adlandırılır [6, 7]. Bu mümkün (və ən çox gizlədilən) birləşmələr yaşa görə insidensiya sıxlığı nümunə götürmə istifadə edərək nəzərə alına bilər. Bu dizayn, SNP və xəstəliyin əldə edilməsi arasındakı əlaqəni ölçür və təsir ölçüsü insidans nisbəti nisbəti olaraq ifadə edilir. GWAS -da rəqabət aparan hadisələri nəzərə alıb -almamaq elmi sualdan asılıdır.Klassik hal nəzarəti tədqiqatı, genotip ilə əlaqənin ölçüsünü təmin edirolan hallarının sıxlığı örnek iş asılı ilə genotip halbuki, xəstə olmaq xəstə.

Bu yazıda iki geniş yayılmış birləşmə ölçüsünü izah edirik: odds nisbəti (OR) və insidans nisbəti nisbəti (IRR) [8]. Ağacdan düşən yarpaqlarla bir bənzətmə istifadə edərək, yayılma və insidans nisbətinin fərqli şərhlərini və rəqabətli hadisələrin xəstəlik assosiasiyalarının şərhinə necə təsir edə biləcəyini izah edirik. Xəstəliyin OR və IRR arasındakı fərqi ətraflı şəkildə başa düşmək və ölçmək üçün nəzarət üçün iki nümunə götürmə üsulunu nəzərdən keçiririk: insidensiya sıxlığı nümunəsi (və ya uyğunlaşma) və əlaqəli olmayan vəziyyətə nəzarət nümunəsi. Rəqabətli hadisələrin fərqli təsirləri altında iki iş dizaynından birliyin təxminləri arasındakı fərqi ölçmək üçün simulyasiyalardan istifadə edirik.

OR və IRR arasında əhəmiyyətli ədəd fərqləri tapırıq. Fərqlər assosiasiya testlərinin p -dəyərlərindəki dəyişiklikdə əks olunur . Tapıntılarımız GWAS -lar üçün əhəmiyyətli nəticələrə malikdir, çünki rəqabətli hadisələr nəticəsində yaranan ciddi yanlış mənfi birləşmələrin riskini göstərir.

Metodlar

Xəstəlik nisbətinə görə yayılma

Rəqabət edən hadisələrin yayılmasını, insidensiyasını və təsirini göstərmək üçün parkdakı böyük bir ağacı təsəvvür etmək olar. Ağacın iki növ yarpağı var: ağır yarpaqlar və yüngül yarpaqlar. İki səviyyəli bir məruz qalma (risk allelinin olması və ya olmaması) olan fərdlərin populyasiyasına uyğun olan dominant modeli nəzərdən keçirin. Ağacdan yarpaqlar düşəndə ​​ya yapışqan torpağa, ya da yapışmayan betona düşə bilər. Betonun üzərinə düşən yarpaqlar nəticədə torpağa köçəcək. Torpağa düşmək yarpağı parçalayacaq, ölməyə, betona düşmək isə xəstələnməyə bərabərdir. Ağacda sağlam yarpaqlar hələ də asılır. Ağır yarpaqlar, yüngül yarpaqlar qədər küləklə asanlıqla aparılmayacaq.və buna görə də ağır yarpaqların ağacın altındakı torpağa yüngül yarpaqlardan daha çox düşmə meyli var və yüngül yarpaqların betona düşmə meyli var. Betonun üzərinə düşən yarpaqlar arasında, ağır yarpaqlar, yüngül yarpaqlara nisbətən torpağa üfürülməzdən əvvəl betonun üzərində daha uzun qalma meylinə malikdir.

Vaxt vahidində ağacdan betona düşən yarpaqların sayı xəstəliyə yoluxur, yəni yüngül yarpaqlar ağır yarpaqlara nisbətən daha yüksək insidansa malikdir. Vaxt vahidində torpağa düşən yarpaqların sayı ölüm nisbətinə uyğundur, yəni yüngül yarpaqların ölüm yarpaqları ağır yarpaqlara nisbətən daha azdır. Xəstəliyin yayılması, ağacın və betonun üzərindəki yarpaqların ümumi sayına nisbətən müəyyən bir müddətdə betonun üzərindəki yarpaqların hissəsidir. Xəstəliyin əmsalları, eyni vaxtda ağacdakı yarpaqların sayı ilə müqayisədə, müəyyən bir vaxtda betonun üzərindəki yarpaqların sayıdır, yəni xəstəliyin yayılması xəstəliyin bir eksi nisbətinə bölünür.

Normalda bir GWAS -da hesablanan OR, yayılma funksiyasıdır. Yüngül yarpaqların xəstəlik ehtimalı ilə ağır yarpaqların xəstəlik nisbətləri arasındakı nisbətdir. Maruz qalma ilə xəstə olma arasındakı əlaqəni ölçür . IRR, yüngül yarpaqların insidans nisbətinin ağır yarpaqların insidans nisbətinin bir hissəsidir və məruz qalma ilə xəstə olma arasındakı əlaqəni ölçür . OR, yarpaqların betona düşmə nisbətindən və həm ağacdan, həm də betondan torpaq üzərində hərəkət edən yarpaqların tezliyindən asılıdır. Bu asılılıqlar səbəbiylə SNP -lər OR yolu ilə bir xəstəliklə əlaqələndirilə bilər, ancaq IRR yolu ilə deyil və əksinə.

Birlik tədbirləri

Maruz qalma və ya nəticə bir populyasiyadakı bütün fərdlər üçün əlçatmaz olduqda, tam bir kohort araşdırması qurmaq mümkün deyil və fərqli nümunələr götürülür. Çox vaxt xəstəliyin baş vermə ölçüsü, müxtəlif məruz qalma qrupları üçün ola biləcək halların sayını nəzarət sayına bölməklə hesablanır. Maruz qalma ilə xəstəlik arasındakı əlaqənin ölçüsü daha sonra iki fərqli ifşa qrupunda xəstəliyin baş vermə ölçüləri arasındakı nisbət olaraq hesablanır [9].

Maraqlı bir xəstəlik və bir xəstəlik arasındakı əlaqəni qiymətləndirmək üçün bir vəziyyətə nəzarət nümunəsindən istifadə edərkən, assosiasiyanın təfsiri nəzarət vasitələrini seçmək üçün istifadə olunan prosedurdan asılıdır. Xəstəliyin başlanğıcına görə nəzarət üsullarını seçmək üçün ümumiyyətlə iki fərqli üsuldan istifadə olunur: əlaqəli olmayan vəziyyətə nəzarət nümunəsi və insidans sıxlığı nümunəsi.

İki nümunə götürmə üsulu Şəkil 1 -də göstərilmişdir. Şəkildəki hər bir üfüqi xətt bir insanın ömrünə uyğundur. Şəxs xətti başlayanda doğulur və xətt bitəndə ölür. Qara almaz maraq xəstəliyinin başlanğıc vaxtını göstərir. Yaşıl yumurtadan çıxmış sahə, halların və nəzarətin klassik bir araşdırması üçün nümunə götürmə müddətinə uyğundur. Yaşıl və qırmızı nöqtələr aşağıda təsvir olunan iki fərqli nümunə götürmə üsulu üçün uyğun olan şəxsləri qeyd edir.

Klassik Case-Control tədqiqatında bütün hallar müəyyən bir müddət ərzində seçilir. Nümunə götürmə vaxtı tədqiqatçılar tərəfindən müəyyən edilir. Nəzarət, nümunə götürmə müddətindən sonra hadisəni yaşamayanlar arasında təsadüfi olaraq eyni şəkildə seçilir (Şəkil 1 -də yaşıl nöqtələr). Nəzarət sayına mütənasib olan hadisələrin sayı xəstəliyin ehtimalını, OR isə iki ehtimal arasındakı nisbət olaraq qiymətləndirilir. Bu quruluşda xəstəliyin meydana gəlməsinin ölçüsü, yayılma funksiyası olan nisbətlərdir [10].

Xəstəlik sıxlığı nümunə götürmə nəzarəti zamanla uzunlamasına seçilir. Nəzarətlər, bir hadisənin ortaya çıxdığı anda xəstəliyin inkişaf riski olan insanlar arasında təsadüfi olaraq seçilir (Şəkil 1 -də qırmızı nöqtələr), yəni nümunə götürmə dövründə maraq xəstəliyi inkişaf etdirən hər bir insanın öz dəsti var. potensial nəzarət. Buna vaxt uyğunluğu da deyilir [11]. Xəstəliyin ölçüsü, növbəti dəfə artımla xəstə olma ehtimalı, yəni xəstəliyə tutulma dərəcəsi kimi şərh edilə bilər. IRR assosiasiya ölçüsüdür [12]. Əgər məlumatlar kiçik bir zaman aralığında daimi bir xəstəlik ehtimalı ehtimalını dəstəkləyirsə, nəzarət vasitələri kiçik bir zaman aralığında seçilə bilər (və müəyyən vaxt nöqtələrində deyil). OR -un əksinə olaraqIRR xəstəliyin yayılmasından asılı deyil.

Uzunlamasına məlumatlar. Hər bir üfüqi xətt bir insanın ömrünü göstərir. Qara rəngli doldurulmuş brilyantlar həmin şəxslərin xəstə olduğunu göstərir. Yaşıl yumurtadan çıxmış sahə, vəziyyətə nəzarət işinin nümunə götürmə müddətini göstərir. Yaşıl nöqtələr, klassik bir vəziyyətə nəzarət işində bütün mümkün nəzarətləri göstərir (dizayn 1). Qırmızı nöqtələr, seçilmiş vəziyyətə uyğun gələn insidans sıxlığı nümunəsi üçün bütün mümkün nəzarətləri göstərir (dizayn 2)

Simulyasiya tədqiqatı

OR və IRR arasındakı fərqləri ölçmək üçün, əgər varsa, bir məruz qalma və iki hadisə ilə uzunlamasına bir iş simulyasiya edirik; xəstəlik və ölüm. Uzunlamasına araşdırmaya 10.000 nəfər daxildir. Bu işdən nəzarətləri toplamaq üçün yuxarıda təsvir edilən nümunə götürmə dizaynlarını istifadə edərək iki fərqli vəziyyətə nəzarət işi hazırlayırıq: insident sıxlığı seçməsindən istifadə edərək klassik vəziyyətə nəzarət işi və uyğun vəziyyətə nəzarət işi. Ətraflı olaraq aşağıdakıları edirik:

Simulyasiya edilmiş məlumatdakı bütün 10.000 fərd üçün Hardy-Weinberg tarazlığı və kiçik bir allel tezliyi (MAF) 0.1, 0.25 və 0.5 fərziyyəsi ilə kiçik allellərin sayını yaradırıq.

Bir məruz qalma ilə uzunlamasına bir məlumat mənbəyi yaratmaq üçün Beyersmann və digərləri tərəfindən müzakirə olunan alqoritmdən istifadə edirik. [13] iki hadisədən istifadə edir: xəstəlik və ölüm. Bir fərdin hər hansı bir hadisəni gözləmə müddəti, zaman keçdikcə iki hadisənin ümumi insidans nisbətinə görə yaradılır. Bir hadisənin verilən vaxt nöqtəsində, xəstəliyin olma ehtimalı, xəstəliyin görülmə tezliyi ilə ümumi insidans nisbəti arasındakı nisbətdir. 90 yaşında hələ də sağ qalan insanlar senzura olunur.

Başlanğıc təhlükələrinin hər iki hadisə üçün Gompertz paylanmasını [14] izlədiyi bir Cox nisbi təhlükə modelindən istifadə edirik. Ölüm hallarının başlanğıcı 85 rejimi və 0.0004 forma parametri olan bir Gompertz paylanmasını izləyir. Ölüm IRR -ə kiçik allel sayının fərqli təsirlərinin sıxlığı Şəkil 2 -də göstərilmişdir. Xəstəliyin başlanğıcı üçün iki fərqli parametr ayarı istifadə olunur: biri 25 rejimi və 0.95 forma parametri ilə, biri 50 rejimi və forma parametri 0.1 ilə. Şəkil 2, IRR -ə kiçik allellərin sayının fərqli təsirləri üçün iki parametr parametrinin sıxlığını göstərir. Şəkil 2 -də qara xətlər ümumi təməl sıxlığa uyğundur. Xəstəliyin ömür boyu riskini ölçmək üçün xəstəliyin insidans nisbətini sabit (1-dən az) vururuq [15].Sabitin fərqli dəyərləri ümumi və nadir xəstəlikləri nəzərə almaq üçün istifadə olunur; nə qədər az olarsa, xəstəlik o qədər nadir olar. Kiçik allellərin sayının xəstəliyə və ölüm hallarına nisbi xətti mütənasib təsirini qəbul edirik, fərqli insidans nisbətləri xəstəliklər üçün 0,5, 1,0, 1,1, 1,2, 1,5, 1,7, 2,0 və 3,0 və 0,5, 0,75, Ölüm üçün 0.9, 1.0, 1.1, 1.2, 1.5, 1.7, 2.0 və 3.0.

Üç nəticənin sıxlığı. Üç növ nəticənin sıxlığı; ölüm və iki fərqli xəstəlik. A alt quruluşundakı qara bərk xətt, 85 yaşında sıxlıq rejimi və 0.0004 bir forma parametri olan bir Gompertz paylamasının sıxlıq funksiyasıdır, yəni ümumi baza. Bu, fərdin yaşı nəzərə alınmaqla ölmək ehtimalındadır. Xəstəlik 1 və Xəstəlik 2 üçün alt quruluşdakı qara bərk xətt, 25 yaşında sıxlıq rejimi və müvafiq olaraq 0.95 forma parametri və 55 yaşında rejim və 0.1 forma parametri olan bir Gompertz paylamasının sıxlıq funksiyasıdır. Bir insanın yaşı nəzərə alınmaqla xəstəliyə tutulma ehtimalı budur. Rəngli xətlər, fərqli genotiplər və SNP ilə ölüm arasındakı fərqli birliklər üçün xəstəliyin ölmə və ya inkişaf ehtimalına uyğundur.

Simulyasiya edilmiş uzunlamasına məlumatlardan, kiçik allellərin sayı ilə xəstəlik arasındakı əlaqəni qiymətləndirmək üçün iki epidemioloji tədqiqat dizaynı hazırlayırıq. İnsidensiya sıxlığı nümunəsi üçün, xəstə olmayan və ölməyən bir şəxs arasında təsadüfi olaraq 5 nəfəri seçirik. Bu, işlərin və nəzarətlərin yaşa görə uyğunlaşdırıldığı fərdi olaraq 1: 5 nisbətində uyğunlaşdırılmış iç içə keçirilmiş vəziyyətə nəzarət tədqiqatı ilə nəticələnir. Kiçik allellərin sayı ilə xəstəlik arasındakı əlaqə şərti logistik reqressiya ilə qiymətləndirilir (bax [7], 7 -ci fəsil).

Vəziyyətə nəzarət nümunəsi ilə əlaqəli olmayan hallar 90 yaşına qədər xəstə olan şəxslərdir. Nəzarətlər 90 yaşına qədər xəstə olmayan bütün insanlar arasında seçilir, yəni nümunə götürmə müddəti doğuşdan 90 yaşa qədərdir (bax Şəkil 1). ). Mümkün nəzarətlərin sayı iş sayının beş qatından çoxdursa, nəzarətlər, hallar və nəzarətlər arasında 1: 5 nisbətində təsadüfi olaraq bərabər seçilir. Vəziyyətə nəzarət nümunəsindəki kiçik allellərin sayı ilə xəstəlik arasındakı əlaqəni logistik reqressiya hesabına qiymətləndiririk ([16] -da 6-cı bölməyə baxın). Əlavə olaraq, hər bir fərd üçün klassik bir vəziyyət nəzarəti işində bir yaş kovaryasyonunu simulyasiya edirik. Nəzarətlər üçün yaş, doğumdan sonrakı təqibin sonuna qədər vahid bir paylanmadan seçilir. Bəzi hallarda kovariat, fərdin diaqnoz qoyulduğu yaşdır.Daha sonra, klassik vəziyyətə nəzarət işində xətti yaş meylinə uyğunlaşdırılmış kiçik allellərin sayı ilə xəstəlik arasındakı əlaqəni qiymətləndiririk.

Ümumilikdə MAF, xəstəlik IRR, ölüm IRR, xəstəliyin nadirliyi və xəstəliyin başlanğıc nisbətinin iki parametr ayarı üçün hər bir konfiqurasiya üçün 1000 uzununa məlumat mənbəyi yaradırıq. Verilmiş təhlildə birləşmə ölçüsü 1000 replikasiyanın ortalaması kimi qiymətləndirilir. Sıfır hipotez, kiçik bir allele sayı ilə xəstəliyin yayılması arasında heç bir əlaqəyə əsaslanmır və nümunə halında edilən sıxlıq tədqiqatında kiçik allellərlə xəstəlik insidansı arasında heç bir əlaqə yoxdur. p-bu fərziyyənin dəyəri, assosiasiya ölçüsü 0 -dan böyük olduqda, 0 -dan az olan təxminlərin nisbətinin 2 misli, assosiasiya ölçüsü isə daha az olduqda, 0 -dan az olan təxminlərin nisbətinin 2 dəfə 1 eksi olduğu təxmin edilir. 0 -dan az olan nisbət 1000 replikasiya əsasında hesablanır (Əlavə fayl 1: proqramlaşdırma detalları üçün R kodu).

Nəticələr

Nəzarətlərin insidensiya sıxlığı nümunələrinin götürülməsi, xəstəliyin başlanğıc xəttindən, ölüm IRR -dən və MAF -dən asılı olmayaraq simulyasiya tədqiqatı ilə təyin olunan əsl IRR -dən ədədi olaraq fərqlənmir (nəticələr göstərilməyib).

Klassik bir vəziyyətə nəzarət işi üçün, Şəkil 3, xəstəliyin başlanğıc nisbətinin hər bir parametri üçün və ümumi və nadir bir xəstəlik üçün (ölüm üçün IRR 0,5, 1.0 və 3.0. Qalan nəticələr onlayn Əlavə 2 faylında verilmişdir: Şəkil S1 və Şəkil S3-də yaşa uyğunlaşdırılmış model üçün müvafiq rəqəmlər daxil olmaqla Şəkil S2). Hər bir alt quruluşda, xəstəliyin əsl IRR, ölüm IRR və MAF -in fərqli parametrləri üçün bir təxmin göstərilir. 90 yaşında xəstəlik ehtimalı, yəni 90 yaşında məcmu insidensiya, ümumi xəstəlik üçün təxminən 22 %, nadir xəstəlik üçün isə 2,5 % -dir (Şəkil 3 əfsanəsinə baxın). Qara bərk diaqonal xətt, təxmin edilən OR ilə əsl IRR arasında heç bir rəqəm fərqi olmadığını göstərir,1 -də qara bərk üfüqi xətt təxmin edilən OR -a görə heç bir əlaqə olmadığını göstərir.

Təxmini birləşmələr. Dörd ssenari göstərilir: iki fərqli xəstəlik (biri nadir və bir ümumi) və xəstəliyin inkişaf ehtimalı üçün iki fərqli parametr ayarı. 90 yaşında xəstə olma ehtimalı, yəni xəstəliyin məcmu insidans dərəcəsi, dörd rəqəm üçün aşağıdakı kimidir. a: 21.8 %, b: 2.3 %, c: 22.9 %və d: 2.6 %. Hər bir alt quruluş, ölümün IRR və MAF -in fərqli dəyərləri üçün kiçik allellərin sayı ilə xəstəlik arasındakı təxmin edilən əlaqəni təqdim edir. Fərqli rənglər ölüm IRR -nin fərqli dəyərlərini və fərqli xətt növləri MAF -in fərqli dəyərlərini göstərir. Eğimli, qara bərk kimlik xətti heç bir önyargı olmadığını və xəstəliyin OR = 1 -də üfüqi xəttin heç bir əlaqənin olmadığını göstərir

Şəkil 4 , iki fərqli nümunə götürmə metodu üçün əsassız hipotezin və xəstəliyin əsl IRR və ölüm IRR -nin fərqli dəyərləri üçün p -dəyərlərini göstərir . Üç eyni rəng-simvol birləşməsi fərqli MAF-ə uyğundur. Şəkil 4 -dəki ssenarilər və simvollar Şəkil 3 -dəki kimidir. P eşlemeli halda nəzarət iş -values üfüqi ox biçdi və p klassik hal-nəzarət öyrənilməsi -values şaquli ox biçdi olunur. Hər bir alt quruluş üçün diaqonalın altındakı yanlış müsbət tapıntıları və diaqonalın üstündəki yanlış mənfi tapıntıları görürük. Hər iki p dəyərinin sıfıra bərabər olduğu ssenarilər çəkilmir.

Dərnəklər üçün p dəyəri. Dörd ssenari göstərilir: Şəkil 3 -də olduğu kimi xəstəliyin inkişaf ehtimalı üçün iki fərqli xəstəlik (biri nadir və bir ümumi) və iki fərqli parametr parametrləri. 3. 90 yaşında xəstə olma ehtimalı, yəni xəstəliyin məcmu insidans dərəcəsi, dörd rəqəm üçün aşağıdakı kimidir. a: 21.8 %, b: 2.3 %, c: 22.9 %və d: 2.6 %. Hər bir alt konfiqurasiya heç bir assosiasiya hipotezinin iki p dəyərinin QQ- sxemidir, biri klassik hal nəzarəti araşdırması altında, digəri isə xəstəliyin əsl IRR və Ölüm RR. Hər iki p -dəyərinin 0 -a bərabər olduğu parametr konfiqurasiyasının nəticələri göstərilmir. Qara düz xətt diaqonalını göstərir

Kiçik allellərin sayı uzunömürlülüklə əlaqədardırsa, yəni ölüm IRR 1 -dən azdırsa, xəstəliyin nadirliyindən, xəstəliyin başlanğıc dərəcəsindən və MAF -dən asılı olmayaraq, təxmin edilən OR xəstəliyin əsl IRR -dən daha böyükdür. . Xəstəliklər üçün əsl IRR dəyəri böyük olduqda fərqlər daha böyük olur və nadir xəstəliklərdən daha çox ümumi xəstəliklər üçün daha böyükdür (Şəkil 3 -də mavi işarələrə baxın). Daha böyük təxminlər yanlış pozitiv tapıntılarda əks olunur. Həqiqi birləşmə olmadıqda (xəstəlik üçün əsl IRR 1 -ə bərabərdir) təxmin edilən OR ümumi xəstəliklər üçün 1 -dən əhəmiyyətli dərəcədə fərqlidir (Şəkil 4 -də mavi işarələrə baxın). Ümumiyyətlə, p klassik halda nəzarət iş -values daha kiçik p-uyğun vəziyyətə nəzarət işinin dəyərləri.

Kiçik allellərin sayı ilə ömrü arasında heç bir əlaqə olmadıqda, yəni ölüm IRR 1 -dirsə, xəstəliyin əsl IRR -i 1 -dən çox olduqda, təxmin edilən OR ümumi xəstəliklər üçün əsl IRR -dən daha böyükdür (Şəkil 2 -də yaşıl işarələr). 3a və c). Nadir xəstəliklər üçün təxmini OR və xəstəliyin əsl IRR arasında heç bir fərq yoxdur (Şəkil 3b və d -də yaşıl işarələr). P klassik halda nəzarət öyrənilməsi və eşlemeli halda nəzarət öyrənilməsi -values, Şəkil beləliklə bütün yaşıl rəmzləri oxşardır. 4 bərk qara xətt edin.

Ölüm üçün əsl IRR 1 -dən böyük olduqda, təxmin edilən OR xəstəlik üçün əsl IRR -dən daha kiçikdir (Şəkil 3 -də qırmızı işarələr). Şəkil 3a -da təxmin edilən OR böyük həqiqi dəyərlər üçün ölüm üçün əsl IRR -dən daha böyükdür. Kiçik təxmin edilən OR yanlış pozitiv əlaqələrə səbəb olur (bax. Şəkil 4a və d). Yanlış mənfi birləşmələr təxmin edilən OR 1 -ə yaxın olduqda və həqiqi IRR 1 -dən böyük olduqda baş verdi, məsələn, xəstəliklə əsl əlaqənin IRR -si 1.7 olduqda (bax. Şəkil 3 və 4c və ya d). Əsl IRR 1.1 (x) -ə bərabərdirsə, Şəkil 4c assosiasiya üçün müsbət test göstərir. Şəkil 3c -dəki eyni simvollar, təxmin edilən OR -un 1 -dən xeyli kiçik olduğunu göstərir, halbuki əsl əlaqə xəstəlik hallarının artmasıdır (əsl IRR 1.1 -ə bərabərdir).

Modeldəki yaşın daxil edilməsi, Şəkil 3 -də A və B ssenarilərindəki təxminlər üçün bir qədər kiçik fərqlər təqdim edir (bax Əlavə fayl 2: Şəkil S1). C ssenarisi üçün ölüm IRR 1 -dən böyük olduqda daha kiçik fərqlər var, ancaq ölüm IRR 1 -dən kiçik və ya bərabər olduqda bir qədər böyük fərq. Ölüm IRR -nin dəyərindən asılı olmayaraq fərqləri əhəmiyyətli dərəcədə azaldır. Ölüm üçün MAF və IRR -in fərqli dəyərləri üçün təxmini OR və xəstəlik üçün əsl IRR arasındakı fərqlər Əlavə şəkil 2 -də göstərilir. : Şəkil S4 və Şəkil S5 (yaşa uyğun olaraq). İkisi arasındakı nisbi fərqlər Əlavə şəkil 2 -də göstərilir: Şəkil S6 və Şəkil S7 (yaşa görə).

Şəkildə D ssenarisi üçün. 3 və 4, 4, Şəkil 5, xəstəliyin IRR -nin 1.0, 1.1 və 1.7 olduğu bütün simulyasiya edilmiş nəticələr üçün p -dəyərlərinin müqayisəsini göstərir (A, B və C ssenariləri onlayn Əlavə 2 -də göstərilir: Şəkil S8, S9 və S10). Qara üfüqi xəttin üstündəki –log çevrilmiş p- dəyərləri klassik hal nəzarəti işini əks etdirir, üfüqi xəttin altındakılar isə uyğun gələn vəziyyət nəzarəti işindən qaynaqlanır. Kesikli xətlər, genom miqyasında əhəmiyyətlilik səviyyəsini 5 · 10–8 göstərir. Aydınlıq üçün 10-16 -dan aşağı olan bütün p dəyərləri kəsilir. Ölüm üçün IRR -in böyük və kiçik dəyərləri üçün və IRR üçün 1.0 və 1.1 -ə bərabərdir, səh-klassik hal-nəzarət tədqiqatından alınan dəyərlər, genom genişliyi baxımından, nümunə götürmə sıxlığı ilə müqayisədə daha aşağıdır. Xəstəlik üçün IRR 1.7 -ə bərabər olduqda, vəziyyətə nəzarət işindən alınan p -dəyərlər, nümunə halının sıxlığı ilə müqayisədə daha tez azalır. Genom miqyasında əhəmiyyət səviyyəsinin altına düşür.

Simulyasiyalardan p -dəyərlərinin müqayisəsi . Ssenari D (Şəkil 3 və Şəkil 4 -dən) göstərilir. Üç alt quruluş, sırasıyla 1.0, 1.1 və 1.7 -ə bərabər olan xəstəliklər üçün IRR -ni təmsil edir. Hər bir alt quruluş, bütün 30.000 simulyasiyalardan -log çevrilmiş p -dəyərlərindən ibarət iki Manhattan sahəsidir. 0 bərk qara xətt yuxarıda ol transformasiya edir p klassik halda nəzarət öyrənilməsi -values və aşağıdakı ol transformasiya var p hallarının sıxlığı nümunə olan -values. Fərqli rənglər MAF -də bir parametr dəyişikliyini və açıq boz şaquli xətlər ölüm IRR -də dəyişiklik olduğunu göstərir. Üfüqi kəsikli xətlər, genom miqyasında 5 · 10-8 səviyyəsinin əhəmiyyətini göstərir

Müzakirə

Xəstəliyin nadirliyinin hər bir konfiqurasiyası, xəstəliyin başlanğıc nisbətinin, MAF -in və xəstəlik və ölüm IRR -nin parametr qəbulu üçün, xəstəliyin nisbət nisbətinin 1000 təxminini simulyasiya etdik. Hər bir konfiqurasiya üçün, xəstəliyin OR -un standart qiymətləndirmələri, mərkəzi limit teoreminə görə (məsələn [17]), standart normal paylanır.

Xəstəliyin təxmin edilən və əsl əlaqəsi ilə insidans sıxlığı nümunəsi istifadə edərək kiçik allellərin sayı arasında heç bir fərq yoxdur. Klassik bir vəziyyətə nəzarət işində, ölüm üçün IRR-dən asılı olaraq hər iki istiqamətdə təxmin edilən OR və əsl IRR arasındakı fərqləri müşahidə edirik. Kiçik allellərin sayı və uzunömürlülük arasında bir əlaqə varsa, yəni ölüm IRR 1 -dən azdırsa, daha böyük bir təxmin edilən OR tapırıq. Kiçik allellərin sayı ilə ölüm arasındakı əlaqə 1 -dən çox olarsa, təxmin edilən OR daha kiçikdir. Ancaq rəqabət edən birliyin təsiri az olduqda bu fərqlər azdır. GWAS -da rəqabətli hadisələrin kiçik təsirləri (1.3 -dən aşağı) gözlənilir, çünki indiyə qədər böyük təsirlərə dair heç bir dəlil tapılmadı.Kiçik allellərin sayı ilə rəqabət aparan hadisələr arasında heç bir əlaqə olmadıqda, xəstəliyin ümumi olduğu təqdirdə daha böyük bir təxmin edilən OR -u tapırıq, halbuki xəstəliyin nadir olması halında heç bir fərq yoxdur. Digərləri oxşar nəticələr tapırlar, məsələn Fradin və digərləri. [18] və Vanq və başqaları. [19].

SNP -nin ölümlə əlaqəli olmaması və xəstəliyin nadir olması halında heç bir fərq tapa bilməməyimiz "nadir xəstəlik fərziyyəsi" olaraq bilinir, yəni xəstəliyin nadir olduğu təqdirdə OR, asimptotik olaraq IRR -ə bərabərdir [9, 20]. SNP ilə rəqabət aparan hadisələr arasında bir əlaqə varsa, "nadir xəstəlik fərziyyəsinin" pozulduğuna diqqət yetirin. Xəstəlik ehtimalına dair bir nəticə, hətta uzunlamasına bir araşdırmada da rəqabətli hadisələr səbəbiylə qərəzli ola bilər. Fine and Gray [21], bir SNP -nin xəstəlik ehtimalına təsirinin assosiasiya testinə imkan verən bir üsul hazırladı.

Şəkil 5 -dən həm yanlış pozitiv hipotezə, həm də yanlış mənfi hipotezə görə p -dəyərlərindəki fərqləri müəyyən edirik . Bu fərqlər qismən daha böyük və ya daha kiçik təxmin edilən OR -dan və ümumi iş sayının araşdırmaların statistik gücünə təsirindən qaynaqlanır. P-dəyər fərqləri, iki tədqiqat dizaynı arasında SNP -lərin fərqli sıralamalarına səbəb ola bilər. Klassik bir vəziyyət nəzarəti tədqiqatından istifadə edərək bir GWAS-da SNP-lərin sıralanması, xəstəliyin yayılması ilə ən çox əlaqəli olan SNP-lərin siyahısını verir, halbuki sıxlıq nümunəli tədqiqat SNP-ləri xəstəliyin etiologiyasına təsirinə görə sıralayır. Birliyin araşdırılmasının məqsədi xəstəliyin genetik etiologiyasında iştirak edən genetik markerləri müəyyən etməkdirsə, insidans sıxlığı nümunəsi götürülməsi təxminlərin düzgün şərhinə imkan verir.

Klassik bir vəziyyətə nəzarət işindən əldə edilən OR qiymətləndirmələrinin bir xülasəsi, məsələn, poligen skorunda, genetik dəyişkənlik üçün bir vəkil olaraq istifadə edildikdə, təxmin edilən OR və IRR arasındakı fərqlər bir ölçüdə toplanır. Bu birləşmənin yaxınlaşmanın etibarlılığına nə dərəcədə təsir edib -etmədiyi bilinmir. Reytinqdəki mümkün dəyişiklik yanlış pozitiv SNP -lərə əsaslanan xülasə statistikaya səbəb ola bilər. Yanlış mənfi SNP -lərin istisna edilməsiylə yaxınlaşma daha çox təsirlənə bilər. Yanlış mənfi SNP -ləri görməməzliyin təsiri bilinmir və əlavə araşdırma tələb olunur.

Yaxşı sənədləşdirilmiş ikiqat qarışıq istifadə edən tədqiqatlarda, insidans sıxlığı nümunə götürülmüş tədqiqat, klassik vəziyyət nəzarəti tədqiqatından daha yüksək gücə malikdir [22, 23]. Ancaq praktikada bu həmişə belə olmaya bilər. Əgər əvvəlcədən təyin edilmiş insidensiya sıxlığı nümunə götürülmüş tədqiqat hər iki hal üzrə bütün lazımi məlumatları toplaya bilmirsə və uyğunluq pozula bilər. 1: 1 uyğun dizaynda bu, məlumatların itirilməsi səbəbindən gücün azalması ilə həm işin, həm də analizin nəzarətinin itirilməsi deməkdir [24]. Klassik hal nəzarəti işində, tək bir mövzu üçün məlumat itkisi, tədqiqatdakı digər mövzular üçün məlumat itkisi demək deyil.

Yarışan hadisələrin olması müşahidə olunan halların sayını azaldacaq və insidans sıxlığı nümunəsində mövcud uyğun dəstlərin sayını azaldacaq. Uyğun bir işin gücü dəstlərin sayından asılıdır və buna görə də güc yarışan hadisənin təsirindən asılıdır. Vəziyyətlərin sayının azalması, klassik bir vəziyyətə nəzarət işinin gücünə də təsir edəcək. Lakin bu təsirin insidensiya sıxlığı nümunəsindən [25] daha kiçik olduğu güman edilir. Bu tədqiqat sahəsindəki ədəbiyyat çox azdır və bir çox suallara hələ də cavab verilməlidir, xüsusən də kəmiyyət ölçüləri və daha mürəkkəb modellər daxil olmaqla.

Bir insident sıxlığı nümunə götürülmüş bir işin planlaşdırılması, müəyyən edilmiş qarışıqlar haqqında məlumat tələb edir və bunlar həmişə mövcud olmur. İnsidensiya sıxlığı nümunəsi altında, informativ olmayan qarışıqların uyğunlaşdırılması bəzi hallarda məlumatların həddən artıq uyğunlaşmasına səbəb ola bilər və bununla da həm təxmin edilən IRR-də, həm də standart xətada qərəz yarada bilər [25]. Bu qarışıqlıq, araşdırmada bənzər olmayan qarışıqlıqlardan biri ilə əlaqədardırsa, qurulmuş bir qarışıqla uyğunlaşma da qərəz gətirir.

Yaşa uyğun gəldikdə, bütün fərdlərin doğum günləri və hadisənin diaqnoz qoyulduğu tarix və ya dövr xüsusilə vacibdir. Bu məlumatları sorğular və ya digər özünü təqdim edən nümunə götürmə üsullarından istifadə etməklə əldə etmək çətin ola bilər. Bu səbəbdən, nümunə götürülmüş insidensiya sıxlığı tədqiqatını, ümumxalq miqyaslı əhaliyə əsaslanan reyestrlərə çıxışı olmayan ölkələrdə həyata keçirmək çətindir.

Bu işdəki simulyasiyalar, yalnız bir zaman miqyası və bir genetik marker daxil olmaqla GWAS -ın sadələşdirilmiş bir nümunəsidir. Yaş artdıqca ölüm riski artdığından, yaş uyğunlaşmaq üçün nəzərə alınması vacib bir faktordur. Digər xəstəliklərdə, təqvim vaxtı diaqnostik sistemdəki dəyişikliklər, siyasətdəki dəyişikliklər və s. Səbəbiylə böyük təsir göstərir. Belə hallarda, hər ikisindən istifadə etmək imkanı məhdud olduqda, iki zaman şkalasından hansının daha vacib olduğunu düşünmək lazımdır. Cinsiyyət, doğum yeri və ya iş mühiti kimi xəstəlik riskinə böyük təsir göstərən uyğunluq üçün digər amillər də nəzərə alınmalıdır.

İnsidensiya sıxlığı nümunəsində nəzarət seçilərkən, xəstəliyin başlanğıcı zamanı hələ də risk altında olan şəxslər arasında nəzarət təsadüfi seçilməlidir. Nəzarətlər, müəyyən bir zaman nöqtəsində təsadüfi bir populyasiya nümunəsidir. Daha sonra hal halına gələn və ya heç vaxt başqa xəstəliklərlə qarşılaşmayan nəzarət vasitələrini tərk etmək, təxmin edilən IRR -ə qarşı qərəzə səbəb olacaq [11, 26].

Ağacın bənzətməsi ilə müqayisədə, bu işdə yarpaq növü ilə betonun üzərindəki yarpaqlar arasında torpağa düşmə ehtimalı arasındakı əlaqə nəzərə alınmır. Bu assosiasiyanın daxil olması təxmin edilən OR -un təfsirini və səh-dəyərlər daha mürəkkəbdir, çünki bu birlik təxmini OR -da əks olunacaq. Bu birlik çox güman ki, hər hansı bir populyasiyada mövcud olacaq. Sadəlik üçün ölümü rəqabət aparan yeganə hadisə kimi də seçmişik. Nəzərə almaq lazımdır ki, bəzi yaş qrupları üçün ölümdən daha çox ehtimal olunan mühacirət kimi digər hadisələr mövcuddur [27]. OR və IRR arasındakı fərq, bütün mümkün rəqabət hadisələrinin məcmusundan təsirlənir. Genetik ictimaiyyəti xüsusi tədqiqat sualını və buna görə də hər hansı bir GWAS üçün nümunə götürməyi diqqətlə nəzərdən keçirməyə çağırırıq.

Nəticələr

Rəqabətli hadisələr, insanları müəyyən nəticələrdən uzaqlaşdıran insan həyatı ilə əlaqəlidir. Xəstəlik ilə əlaqəli etioloji faktorların müəyyən edilməsi üçün maraq xəstəliyə tutulma riskidir. Klassik halda nəzarət öyrənilməsi istifadə xəstə olma riski və bias dərnək smeta və may genetik variantlar arasında birliyin qiymətləndirmək üçün p dərnək test -value. Nümunə sıxlığı nümunə götürülmüş tədqiqat, təxmin edilən assosiasiyanın düzgün təfsirini və əlavə təhlil üçün SNP -lərin düzgün sıralanmasını təmin edəcəkdir.

Təsdiq

İnteqrativ Psixiatriya Araşdırma The Lundbeck Foundation Initiative, baxmayaraq ki bu işin Lundbeck Fondu tərəfindən maliyyələşdirilir i Psych eləcə də Stanley Medical Research Institute, Bethesda, Maryland. Müəlliflərin heç birinin maraq toqquşması yoxdur.