Bəy Keyvərdə

Bu bölmədə glm () funksiyasının logistik reqressiya modellərini uyğunlaşdırmaq üçün istifadəsini ailə binomialı və link logitli ümumiləşdirilmiş xətti modelin xüsusi bir vəziyyəti olaraq təsvir edirik.

3.3 İki Qrupun Müqayisəsi

Mühazirə qeydlərindən sonra iki qrupu müqayisə edəcəyik və sonra ikidən artıq qrupa keçəcəyik.

2-dən 2-ə qədər cədvəl

Cədvəl 3.2 -də daha çox uşaq arzusu ilə kontraseptivlərin istifadəsinə dair məlumatları nəzərdən keçirin (qeydlərin 14 -cü səhifəsi). Bu məlumatları 2 binomial müşahidələr olaraq R -də oxuya bilərik. Həyatı asanlaşdırmaq üçün, daha çox uşaq istəməyən qadınlar üçün 1, əks halda 0 dəyərini alan bir uşaq dəyişikliyi olaraq daha çox uşaq arzusuna girəcəyəm:

Homojenliyin yoxlanılması

Null modeli uyğunlaşdıraraq başlayaq. R -də fərdi məlumatların nəticəsi birlərin və sıfırların vektorudur, lakin qruplaşdırılmış məlumatlarla əvvəlcə yaratdığımız uğur və uğursuzluqların sayına malik bir matrisdir:

Ailəni binomial olaraq təyin etmək, standart olaraq logit bağlantısı təmin edir. (Qeyd edək ki, müvafiq arqument ailənin adı deyil , sapma, keçid və tərs bağlantı kimi şeylərin necə hesablanacağını izah edən bir funksiyadır.)

Konstantanın qiymətləndirilməsinin kontrasepsiya vasitəsi ilə nisbətin məntiqi olduğunu yoxlamaq asandır:

Mən logiti bahislərin jurnalı olaraq hesabladım. Alternativ olaraq standart logistika paylama kvantları üçün qlogis istifadə etməkdir. Tərs funksiya plogisdir.

Standart səhvlər əldə etmək üçün xülasə funksiyasından istifadə etməliyik

Müşahidə olunan logitin təxmin edilən standart səhvinin 1/müvəffəqiyyətlər + 1/uğursuzluqların kvadrat kökü olduğunu yoxlaya bilərsiniz.

Logit üçün güvən aralığını əldə etmək üçün confint istifadə edirik. Ehtimal miqyasına çevirmək üçün tərs logitləri hesablayırıq

Nəticə, Stata kimi digər paketlərlə əldə edə biləcəyinizdən fərqlidir, çünki R, bir Box-Cox çevrilməsini hesabladığımız zaman olduğu kimi, bir profil qeyd ehtimalını istifadə edir. Standart yanaşma, mle -nin böyük nümunə paylanmasına əsaslanan smeta plus/minus 1.96 standart səhvlərindən istifadə edir.

Daha ənənəvi güvən aralığını əldə etməyin daha sadə yolu, metod göndərilməsini atlayan və confint.gml əvəzinə standart metodu çağıran confint.default funksiyasından istifadə etməkdir:

Modelin sapması bir df -də 91.67 -dir, sıfır modelin məlumatlara uyğun olmadığını sübut edən çoxlu sübutlar. Başqa sözlə, daha çox uşaq arzusu ilə kontraseptiv istifadədə heç bir fərq olmadığı hipotezini rədd edirik.

Bu sapmanı "əllə" hesablamaq öyrədici ola bilər. Hər bir qrup üçün proqnozlaşdırılan ehtimalı əldə etmək üçün təchiz olunmuşlardan istifadə edə bilərik, lakin bu, əlbəttə ki, əvvəllər hesablandığı kimi p -dir:

Eyni yanaşma, Pearsonun xi-square statistikasını hesablamaq üçün istifadə edilə bilər:

Bir df-də 92.64 statistikası əldə edirik. Bunun bir zolaqlı təxmini təxmini istifadə edərək iki nisbət müqayisə etmək üçün standart z-testinin kvadratı olduğunu da yoxlamaq istəyə bilərsiniz.

Oran nisbəti

İndi modeli proqnozlaşdırıcı olaraq "artıq istəmirəm" uşaqları ilə uyğunlaşdırırıq. Bu model iki ehtimalın modelləşdirilməsi üçün iki parametrdən istifadə edərək bu verilənlər bazası üçün doymuşdur, buna görə də sıfır sapması var

Sabit, daha çox uşaq sahibi olmaq istəyən qadınlar arasında kontrasepsiya istifadə etmə ehtimalına uyğundur və nomore əmsalı iki qrup arasındakı log-odds fərqidir.

Bu katsayını gücləndirərək təxminən üç nisbət alırıq. Məşhur inancın əksinə, bu "daha çox uşaq istəməyən qadınların daha çox istəyənlərə nisbətən kontrasepsiya vasitələrindən istifadə etmə ehtimalı üç qat daha çoxdur" demək deyil. Bu təfsirdə iki problem var.

Birincisi, və daha önəmlisi, bu bahisüç dəfə adətən "ehtimalı" aydın nə daha çox deyil, ehtimal, istəyən qadınlar o heç bir daha çox uşaq istəyən qadınlar arasında kontrasepsiya istifadə. Əgər araşdırılan hadisə nadir olsaydı, şərh təxminən doğru olardı, çünki əgər p kiçikdirsə, 1-p birinə yaxındır və nisbət nisbəti nisbi risklə təxminən eynidir. Burada müşahidə olunan nisbətlər 0.454 və 0.225 və nisbət 2.01 -dir, buna görə daha çox uşaq istəməyən qadınların daha çox istəyənlərə nisbətən kontrasepsiya istifadə etmə ehtimalı iki dəfə çoxdur.

İkincisi, ehtimal üç qat artırılsa belə, bu, qadınların üç dəfə yox, iki dəfə daha çox kontrasepsiya istifadə etməsinə səbəb olardı. Bu vəziyyətdə ehtimal iki qat artır və bu, qadınları iki dəfə deyil, iki qat dahaçox edir.

Testin əhəmiyyəti

Z-statistikası, qeydlərin 16-cı səhifəsində bildirildiyi kimi. Gəlin onu kvadratlaşdıraq:

Nəticədə 89.78 olan x-kvadrat, Wald'ın nomore əmsalının sıfır olduğu və ya nisbət nisbətinin bir olduğu fərziyyəsini sınamaq üçün statistikasıdır.

Bu, sıfır və "nomore" modellər arasındakı fərqlər arasındakı fərq kimi əldə etdiyimiz 91.67 ehtimal nisbətinə bənzəyir, lakin eyni deyil. (Bu vəziyyətdə, sıfır morelin sapması ilə eynidir, çünki "nomore" modeli məlumatlar üçün doymuşdur.)

Güvən Aralıqları

Bəzi və ya bütün parametrlər üçün etibar intervallarını hesablaya bilərik. Yenə də R bir ehtimal ehtimalından istifadə edir, ancaq şərti etibar intervallarını əldə etmək üçün confint.default istifadə edə bilərik. Hər iki tərəfdəki nisbət nisbəti üçün nəticələr:

Beləliklə, daha çox uşaq istəməyən qadınlar arasında kontrasepsiya vasitələrinin istifadəsi, daha çox uşaq sahibi olmaq istəyən qadınlar üçün 2.30-3.55 dəfə çoxdur. (Profil ehtimalı, demək olar ki, eyni nəticələr verir, üçüncü onluq yerdəki kiçik fərqlərlə.)

Hər halda, etibar intervallarının logit miqyasında işlədildiyini və sonra nisbət nisbətlərini əldə etmək üçün eksponentləşdirildiyini unutmayın. Oran nisbəti və onun standart xətası ilə işləmirik (delta metodundan istifadə etməklə əldə edilə bilər), çünki normal yaxınlaşma məhdudiyyətsiz logit miqyasında daha yaxşıdır.