Adi Logistik Reqressiya | R Məlumat Analizi Nümunələri

Bu səhifədəki nümunələri işə salmadan əvvəl aşağıdakı paketləri yükləyə biləcəyinizdən əmin olun. Yüklü bir paketiniz yoxdursa, çalıştırın: install.packages ("packagename") və ya versiyanın köhnə olduğunu görürsünüzsə, run: update.packages ().

Versiya məlumatı:Bu səhifənin kodu R versiyası 3.1.1 (2014-07-10) ilə sınaqdan keçirildi: 2014-08-21 İlə: reshape2 1.4; Hmisc 3.14-4; Formula 1.1-2; sağ qalmaq 2.37-7; qəfəs 0.20-29; MASS 7.3-33; ggplot2 1.0.0; xarici 0.8-61; knitr 1.6

Diqqət:Bu səhifənin məqsədi müxtəlif məlumat təhlili əmrlərindən necə istifadə olunacağını göstərməkdir. Tədqiqatçıların etmələri gözlənilən tədqiqat prosesinin bütün aspektlərini əhatə etmir. Xüsusilə, məlumatların təmizlənməsi və yoxlanılması, fərziyyələrin yoxlanılması, model diaqnostikası və ya potensial təqib təhlillərini əhatə etmir.

Sadə logistik reqressiya nümunələri

Nümunə 1: Bir marketinq araşdırma firması, insanların fast-food şəbəkəsində sifariş verdiyi soda miqdarına (kiçik, orta, böyük və ya çox böyük) hansı amillərin təsir etdiyini araşdırmaq istəyir. Bu amillərə hansı növ sendviçin (burger və ya toyuq), qızardılmış kartofun da daxil olub -edilməməsi və istehlakçının yaşı daxil ola bilər. Nəticə dəyişən, soda ölçüsü, açıq şəkildə sifariş edilsə də, müxtəlif ölçülər arasındakı fərq uyğun deyil. Kiçik və orta arasındakı fərq 10 unsiya, orta ilə böyük arasında 8, böyük və əlavə böyük 12 arasında.

Nümunə 2: Bir tədqiqatçı, olimpiya üzgüçülüyündə medallaşmaya təsir edən amillərlə maraqlanır. Müvafiq proqnozlaşdırıcılara məşq saatları, pəhriz, yaş və idmançının vətənində üzgüçülük populyarlığı daxildir. Tədqiqatçı hesab edir ki, qızıl və gümüş arasındakı məsafə gümüş və bürünc arasındakı məsafədən daha böyükdür.

Nümunə 3: Bir araşdırma, aspiranturaya müraciət edib etməyəcəyinizə qərar verməyə təsir edən amilləri araşdırır. Kollec gənclərindən aspiranturaya müraciət etmə ehtimallarının, bir qədər ehtimallı və ya çox ehtimallı olub olmadıqları soruşulur. Beləliklə, nəticə dəyişənimizin üç kateqoriyası var. Bakalavr təhsil müəssisəsinin dövlət və ya özəl olması və valideynlərin təhsil vəziyyəti ilə bağlı məlumatlar və mövcud GPA da toplanır. Tədqiqatçıların bu üç nöqtə arasındakı "məsafələrin" bərabər olmadığını düşünməyə əsasları var. Məsələn, "mümkün olmayan" ilə "bir qədər ehtimal olunan" arasındakı "məsafə" "bir qədər ehtimal olunan" ilə "çox ehtimal olunan" arasındakı məsafədən daha qısa ola bilər.

Verilənlərin Təsviri

Aşağıdakı məlumat təhlili üçün aspiranturaya müraciətlə bağlı 3 -cü nümunəni genişləndirəcəyik. Bu nümunə üçün bəzi məlumatları simulyasiya etdik və veb saytımızdan əldə edə bilərsiniz:

Bu hipotetik məlumat dəsti, nəticə dəyişənimiz olaraq istifadə edəcəyimiz müvafiq olaraq 1, 2 və 3 kodlu, "ehtimal", "bir qədər ehtimal" və "çox ehtimal" səviyyələri olan tətbiq adlanan üç səviyyəli dəyişənə malikdir. Həm də proqnozlaşdırıcı olaraq istifadə edəcəyimiz üç dəyişənimiz var: ən azı bir valideynin ali təhsilli olub olmadığını göstərən 0/1 dəyişənidir; ictimai, bu 0/1 dəyişənidir, burada 1, lisenziya təşkilatının ictimai və 0 özəl olduğunu göstərir və gpa, tələbənin not ortalamasıdır. Bu dəyişənlərin təsviri statistikasından başlayaq.

GPA -nın hər səviyyədə tətbiq olunmasını və ictimaiyyət tərəfindən bölünməsini və parçalanmasını da araşdıra bilərik. Bu, hər bir tətbiq səviyyəsi üçün, ayrılmış və ictimaiyyətin xüsusi dəyərləri üçün gpa qutusu olan 2 x 2 ızgara yaradır. Veriləri daha yaxşı görmək üçün, az miqdarda səs -küylə (tez -tez "titrəmə" adlanır) və 50% şəffaflıqla qutu sahələrinin üstünə xam məlumat nöqtələrini əlavə edirik, beləliklə qutu sahələrini sıxışdırmırlar. Nəhayət, hüceyrələrə əlavə olaraq, bütün marjinal əlaqələri qururuq. Kenar boşluqları, son süjetin 3 x 3 ölçüsündə bir grid halına gətirir. Sağ alt küncdə, tətbiq və gpa arasındakı ümumi əlaqə bir qədər müsbət görünür. Bunu etmək üçün ggplot2 paketindən istifadə edirik.

Düşünə biləcəyiniz analiz üsulları

Aşağıda qarşılaşa biləcəyiniz bəzi analiz metodlarının siyahısı verilmişdir. Sadalanan metodlardan bəziləri olduqca məqbuldur, digərləri ya lütfdən düşmüş və ya məhdudiyyətlərə malikdir.

  • Sifarişli logistik reqressiya: bu səhifənin diqqət mərkəzindədir.
  • OLS reqressiyası: Bu analiz problemlidir, çünki OLS fərziyyələri fasiləsiz nəticə dəyişənləri ilə istifadə edildikdə pozulur.
  • ANOVA: Yalnız bir fasiləsiz proqnozlaşdırıcıdan istifadə edirsinizsə, modeli "çevirə" bilərsiniz ki, deyək ki, gpa nəticə dəyişənidir və tətbiq etmək də proqnozlaşdırıcı dəyişən idi. Sonra bir tərəfli ANOVA işlədə bilərsiniz. Yalnız bir proqnozlaşdırıcı dəyişəniniz varsa (logistik modeldən) etsəniz, bu pis bir şey deyil və bu davamlıdır.
  • Multinomial logistik reqressiya: Bu, nəticə dəyişəninin kateqoriyalarında heç bir nizamın olmadığı (yəni kateqoriyaların nominal olduğu) istisna olmaqla, sifarişli logistika reqressiyasına bənzəyir. Bu yanaşmanın dezavantajı, sifarişdə olan məlumatların itirilməsidir.
  • Sifarişli probit reqressiyası: Bu, sifarişli bir logistika reqressiyasına çox bənzəyir. Əsas fərq əmsalların təfsirindədir.

Sifarişli logistika reqressiyası

Aşağıda sifarişli bir logistik reqressiya modelini qiymətləndirmək üçün MASS paketindəki polr əmrindən istifadə edirik. Komanda adı, modelimizdəki nisbi nisbət fərziyyəsini vurğulayaraq, orantılı odds logistik reqressiyasından irəli gəlir. polr, proqnozlaşdırıcıların izlədiyi nəticəsi olan bir reqressiya modelini təyin etmək üçün R -də standart düstur interfeysindən istifadə edir. Modelin standart səhvləri əldə etmək üçün istifadə olunan optimallaşdırmadan (Hessian adlanır) müşahidə olunan məlumat matrisini qaytarması üçün Hess = TRUE -ı da təyin edirik.

Təriflər

Katsayıların necə şərh ediləcəyini başa düşmək üçün əvvəlcə bəzi qeydlər quraq və sıravi logistik reqressiya ilə əlaqəli anlayışları nəzərdən keçirək. $ Y $, $ J $ kateqoriyalarının sıralı bir nəticəsi olsun. Sonra $ P (Y \ le j) $, $ Y $ -ın müəyyən bir kateqoriya $ j = 1, \ cdots, J-1 $ -dan az və ya ona bərabər olan məcmu ehtimaldır. Müəyyən bir kateqoriyadan az və ya bərabər olma ehtimalı olaraq təyin edilə bilər

$ j = 1, \ cdots, J-1 $ üçün $ P (Y>J) = 0 $ olduğundan və sıfıra bölünməsi qeyri-müəyyəndir. Log bahisda kimi tanınır LogITki,

R -nin polrunda sıravi logistik reqressiya modeli kimi parametrləşdirilir

$$ logit (P (Y \ le j)) = \ beta_ - \ eta_ x_1 - \ cdots - \ eta_

$ x

Sonra aşağıdakı sıravi logistik reqressiya modelinə uyğunlaşa bilərik:

Təxmini model belə yazıla bilər:

$$ \ başlayın logit (\ şapka

(Y \ le 1)) & = & 2.20-1.05*PARED-(-0.06)*PUBLIC-0.616*GPA \\ logit (\ hat

(Y \ le 2)) & = & 4.30-1.05*PARED-(-0.06)*PUBLIC-0.616*GPA \ end $$

Yuxarıdakı çıxışda görürük

  • Zəng et, bu bizə hansı modelin işlədiyimizi, hansı variantları göstərdiyimizi və s.
  • Sonra, hər bir əmsalın dəyərini, standart səhvləri və t dəyərini özündə əks etdirən adi reqressiya çıxış əmsalı cədvəlini görürük, bu, sadəcə əmsalın standart səhvinə nisbətidir. Varsayılan olaraq əhəmiyyətlilik testi yoxdur.
  • Sonra, bəzən kəsmə nöqtələri adlanan iki kəsmə üçün təxminləri görürük. Tutmalar, məlumatlarımızda müşahidə etdiyimiz üç qrupu yaratmaq üçün gizli dəyişənin harada kəsildiyini göstərir. Bu gizli dəyişənin davamlı olduğunu unutmayın. Ümumiyyətlə, nəticələrin təfsirində istifadə edilmir. Çıxış nöqtələri digər statistik paketlər tərəfindən bildirilən eşiklərlə sıx bağlıdır.
  • Nəhayət, qalıq sapmanı, modelin -2 * Log ehtimalını və AIC -ni görürük. Həm sapma, həm də AIC model müqayisə üçün faydalıdır.

Bəzi insanlar ap dəyəri olmadan məmnun deyillər. Bu vəziyyətdə p dəyərini hesablamağın bir yolu, az testi kimi t-dəyərini standart normal paylama ilə müqayisə etməkdir. Əlbəttə ki, bu, yalnız sonsuz sərbəstlik dərəcələri üçün doğrudur, lakin nümunələrin ölçüsü azaldıqca getdikcə qərəzli olur və böyük nümunələr tərəfindən kifayət qədər yaxınlaşdırılır. Bu yanaşma Stata kimi digər proqram paketlərində istifadə olunur və bunu etmək mənasızdır. Əvvəlcə əmsal cədvəlini saxlayırıq, sonra p dəyərlərini hesablayırıq və yenidən cədvəllə birləşdiririk.

Parametr qiymətləndirmələri üçün də etibar intervallarını əldə edə bilərik. Bunlar ya ehtimal funksiyasını profilləşdirməklə, ya da standart səhvlərdən istifadə etməklə və normal paylanmanı qəbul etməklə əldə edilə bilər. Qeyd edək ki, profilli CI -lər simmetrik deyillər (baxmayaraq ki, onlar ümumiyyətlə simmetrikə yaxındır). 95% CI 0 -ı keçmirsə, parametrlərin qiymətləndirilməsi statistik olaraq əhəmiyyətlidir.

Həm pared, həm də gpa üçün CI -lərə 0 daxil deyil; ictimai edir. Çıxışdakı təxminlər sifarişli logitlərin vahidlərində və ya sifariş edilmiş günlük nisbətlərində verilir. Beləliklə, ayrılanlar üçün deyirik ki, ayrılan bir vahid artım üçün (yəni 0 -dan 1 -ə qədər), bütün digər dəyişənləri nəzərə alaraq, log odds miqyasında tətbiqin gözlənilən dəyərində 1.05 artım gözləyəcəyik. model sabit saxlanılır. Gpa üçün deyərdik ki, gpa -da bir vahid artım üçün, modeldəki digər dəyişənlərin hamısının sabit saxlanıldığı nəzərə alınmaqla, log odds şkalasında tətbiqin gözlənilən dəyərində 0.62 artım gözləyəcəyik.

Modeldən əmsalları qeyd etmək üçün bir qədər çətin ola bilər, çünki onlar loglar baxımından ölçülür. Logistik reqressiya modellərini şərh etməyin başqa bir yolu, əmsalları nisbət nisbətlərinə çevirməkdir. OR və güvən intervallarını əldə etmək üçün yalnız təxminləri və güvən intervallarını əsaslandırırıq.

Bu əmsallara mütənasib nisbət əmsalları deyilir və bunları ikili logistika reqressiyasından əmsalları nisbətləndirdiyimiz kimi şərh edərdik.

Oran nisbətini şərh etmək

Ehtimal nisbətinin ehtimalın necə təyin olunduğuna və nisbətlərin istiqamətinə əsaslanan bir çox ekvivalent şərhlər var. Ətraflı bir əsaslandırma üçün, R -də sıralı bir logistik reqressiyadakı əmsalları necə şərh edim? Aşağıdakı (*)işarəsi seçimlər arasında ən asan təfsiri ifadə edir.

Valideyn təhsili

  1. (*)Valideynləri tələbələr üçün etdi qatılacaq kollec, olan bahis dahaçox ehtimal (yəni, çox və ya bir qədər çox güman ki, çətin qarşı) tətbiq ki, valideynlər bütün digər dəyişənlər sabit keçirilməsi, kollec getmədi tələbələr 2,85 dəfə çoxdur.
  2. Valideynlərindən etdi tələbələr üçün deyil kollec iştirak, olan odds az(yəni tətbiq ehtimalı çətin qədər və ya çox güman ki, qarşı) bütün digər dəyişənlərin sabit keçirilməsi ki, valideynlər kollec getmək idi tələbə 2,85 dəfə edir.

Məktəb Növü

  1. İctimai məktəb tələbələri üçün olan odds dahaçox ehtimal (yəni, çox və ya bir qədər çox güman ki, çətin qarşı) müraciət etmək 5.71% aşağıdır bütün digər dəyişənlər sabit keçirilməsi, xüsusi məktəb tələbələri daha [yəni (1 -0.943) 100% x] .
    • (*)Xüsusi məktəb tələbələri üçün olan odds daha çox ehtimal tətbiq etməkdir 1,06 dəfə [yəni, 1 / 0.943] ki, bütün digər dəyişənlər (müsbət odds nisbəti) daimi keçirilməsi ictimai məktəb tələbə.
  2. Şəxsi məktəbdə oxuyan şagirdlər üçün, müraciət etmə ehtimalı daha azdır (yəni, bir qədər ya da çox ehtimal olunmur ), bütün digər dəyişənləri sabit saxlayaraq dövlət məktəbi şagirdlərindən 5.71% aşağıdır.
    • Dövlət məktəbində oxuyan tələbələr üçün, daha az müraciət etmə ehtimalı, bütün digər dəyişənləri (müsbət nisbət nisbəti) sabit saxlayan özəl məktəb şagirdlərindən 1,06 dəfə çoxdur.
  1. (*)Hər bir vahid üçün olan bürüşməktələbə GPA olan odds dahaçox ehtimal (tətbiq etmək çox və ya bir qədər çox güman ki, çətin qarşı) daimi bütün digər dəyişənlər keçirilməsi, 1.85 dəfə (yəni, 85% artıb) vurulur.
  2. Tələbə GPA -nın hər bir vahid azalmasıüçün, tətbiq olunma ehtimalının azolması ehtimalı ( bir qədər və ya çox ehtimal olunmayan ) 1.85 dəfə çoxalır və bütün digər dəyişənləri sabit saxlayır.

Proportional odds fərziyyəsi

Sıra logistik (və ordinal probit) reqressiyanın əsasını təşkil edən fərziyyələrdən biri, hər bir nəticə qrupu arasındakı əlaqənin eyni olmasıdır. Başqa sözlə, sıravi logistika reqressiyası, ehtimal ki, cavab dəyişəninin bütün ən aşağı kateqoriyalara nisbəti ilə əlaqəsini təsvir edən əmsalların, növbəti ən aşağı kateqoriya ilə bütün yüksək kateqoriyalar arasındakı əlaqəni təsvir edənlərlə eyni olduğunu düşünür. Buna mütənasib nisbət fərziyyəsi və ya paralel reqressiya fərziyyəsi deyilir. Bütün qrup cütləri arasındakı əlaqə eyni olduğu üçün yalnız bir əmsal dəsti var.

Əgər belə olmasaydı, hər bir nəticə qrupu arasındakı əlaqəni təsvir etmək üçün modeldə fərqli əmsal dəstlərinə ehtiyacımız olardı. Beləliklə, modelimizin uyğunluğunu qiymətləndirmək üçün mütənasib nisbət fərziyyəsinin etibarlı olub olmadığını qiymətləndirməliyik. Bunu etmək üçün bəzi proqram paketlərində statistik testlər mövcuddur. Bununla birlikdə, bu testlər sıfır fərziyyəni rədd etmək meylinə görə tənqid edilmişdir (əmsalların çoxluğu eynidir) və buna görə də ehtimalın mövcud olduğu hallarda paralel yamaclar fərziyyəsinin orada olmadığını göstərir (bax. Harrell 2001 s. 335). Paralel yamaclar fərziyyəsini yoxlamaq üçün ümumiyyətlə istifadə edilən testlərdən heç birini yerinə yetirmək üçün R -də bir obyekt tapa bilmədik. Bununla birlikdə, Harrell paralel yamaclar fərziyyəsini qiymətləndirmək üçün qrafik metodu tövsiyə edir.Bu qrafikdə göstərilən dəyərlər, y -nin müəyyən bir dəyərdən böyük və ya ona bərabər olma ehtimalını (hər bir y səviyyəsi üçün) modelləşdirmək üçün istifadə olunan bir logit modelindən (xətti) proqnozlardır. vaxt. Bu qrafiki yaratmaq üçün Hmisc kitabxanasına ehtiyacınız olacaq.

Aşağıdakı kod iki əmrdən ibarətdir (birinci əmr birdən çox sətrə düşür) və bu qrafiki yaratmaq üçün orantılı nisbət ehtimalını yoxlamaq üçün istifadə olunur. Əsasən, nəticələr qruplarının>= 2 və>= 3 tətbiq etməklə təyin olunduğu tək bir proqnozlaşdırıcı ilə fərdi logistika reqressiyalarından proqnozlaşdırılan logitləri qrafikləşdirəcəyik. Nəticə>= 2 və ya>= 3 tətbiq etməklə təyin olunsa da, orantılı ehtimal fərziyyəsinin etibarlı olduğuna əmin ola bilərik. Başqa sözlə, pared = 0 və pared = 1 üçün logits arasındakı fərq, nəticə tətbiq edildikdə>= 2, nəticə tətbiq edildikdə fərq>= 3 ilə eynidirsə, ehtimal ki, mütənasib nisbət fərziyyəsi qüvvədədir.

Birinci əmr, qrafik ediləcək dəyərləri təxmin edən bir funksiya yaradır. Bu əmrin ilk sətri R -ə sf -in bir funksiya olduğunu və bu funksiyanın y olaraq etiketlədiyimiz bir arqument götürdüyünü bildirir. Sf funksiyası, hədəf dəyişənin hər bir dəyərindən böyük və ya bərabər olma ehtimalını hesablayacaq. Məqsədlərimiz üçün, tətbiq nisbətlərinin 2 -dən çox və ya 3 -ə bərabər, sonra isə 3 -dən çox və ya bərabər olmasını istərdik. Bağımlı dəyişəninizdəki kateqoriyaların sayından və dəyişənlərinizin kodlaşdırılmasından asılı olaraq bu funksiyanı redaktə etmək üçün. Aşağıda funksiya y üçün qurulmuşdurüç səviyyəli dəyişən, 1, 2, 3. Əgər asılı olan dəyişənin 1, 2, 3, 4 etiketli 4 səviyyəsi varsa, 'Y>= 4' = qlogis (ortalama (y>= 4)) əlavə etməlisiniz. tırnak işarələrini çıxarmaqla) birinci mötərizədə. Bağımlı dəyişəniniz 1, 2, 3 əvəzinə 0, 1, 2 kodlu olsaydı, hər bir 1 nümunəsini 0, 2 ilə 1 və s. Əvəz etməklə kodu redaktə etməlisiniz. Sf funksiyasının içərisində qlogis funksiyasını tapırıq ki, bu da bir ehtimalın loqitə çevrilməsinə səbəb olur. Beləliklə, qlogis -ə 2 və ya 3 -dən çox olma ehtimallarını əsas olaraq qidalandıracağıq və bu ehtimalların logit çevrilmələrini qaytaracaq. Qlogis funksiyasının içərisində görürük ki, y>= 2 ortalamasının log oddsunu istəyirik. Sf funksiyasına müraciət etmək kimi ay arqumenti verdiyimiz zaman, y>= 2 0/1 (YANLIŞ/DOĞRU) vektoruna qiymət verəcək,və bu vektorun ortalamasını götürsəniz,>= 2 tətbiq olunan nisbətini və ya ehtimalını verərsiniz.

Aşağıdakı ikinci əmr, proqnozlaşdırıcılar tərəfindən müəyyən edilmiş məlumatların bir neçə alt qrupunda sf funksiyasını çağırır. Bu ifadədə, ilk arqument olaraq verilən bir düsturla xülasə funksiyasını görürük. R, bir düstur arqumenti ilə xülasə çağırışı gördükdə, düsturun sol tərəfindəki dəyişən üçün formulun sağ tərəfindəki qruplara görə təsviri statistikanı hesablayacaq və nəticələrini gözəl bir cədvəldə qaytaracaq. Varsayılan olaraq, xülasə sol tərəfdəki dəyişənin ortalamasını hesablayacaq. Beləliklə, kod xülasəsini istifadə etsəydik (say kimi (tətbiq)

pared + public + gpa) əyləncəli mübahisə etmədən, 4 bərabər qrupa bölünərək pared, sonra ictimaiyyət və nəhayət gpa tətbiq etmək vasitələrini əldə edərdik. Bununla birlikdə, öz funksiyamızı təmin etməklə ortalamanın hesablanmasını ləğv edə bilərik, yəni fun = arqumentinə sf. Son əmr, R -dən məzmunu bir c olan obyektə qaytarmasını xahiş edir.

Yuxarıdakı cədvəl, paralel yamaclar fərziyyəsi olmadan, asılı olan dəyişənimizi proqnozlaşdırıcı dəyişənlərimizə bir dəfəyə geri çəksək əldə edəcəyimiz (xətti) proqnozlaşdırılan dəyərləri göstərir. Paralel yamaclar fərziyyəsini, asılı dəyişən üzərində dəyişən kəsmə nöqtələri olan bir sıra ikili logistika reqressiyalarını işlədərək və kəsilmə nöqtələri arasındakı əmsalların bərabərliyini yoxlayaraq qiymətləndirə bilərik. Buna görə də, dayanıqlılığını yoxlamaq üçün paralel yamaclar fərziyyəsini rahatlaşdırırıq. Bu məqsədlə, biz orijinal, sıra asılı dəyişən (burada tətbiq) az bir dəyəri daha əgər sıfıra bərabərdir yeni, ikili, asılı dəyişən daxil orijinal, sıra, asılı dəyişən çevirmək a sıra dəyişən əgər, 1 a -dan böyük və ya bərabərdir(unutmayın, sıravi reqressiya modeli əmsalları da bunu göstərir). Bu, sıralı dəyişənin k-1 səviyyələri üçün edilir və aşağıdakı kimi kodlaşdırılır (müraciət edin)>= a . Kodun ilk sətri, "bir qədər ehtimal olunan" və ya "bir qədər ehtimal olunan" və ya "çox ehtimal olunan" tətbiqetmənin seçilməsinin təsirini qiymətləndirir. İkinci kod xətti, "çox ehtimal olunan" və ya "çox güman ki" tətbiq etmənin "çox ehtimal olunan" seçiminə təsirini qiymətləndirir. Bu modelin kəsişməsinə (-0.3783) baxdığımızda, Y>= 1 sütunundakı "yox" a bərabər olan xanadakı proqnozlaşdırılan dəyərə uyğun olduğunu görürük. kəsilmə və ayrılmış üçün əmsalına bərabərdir (yəni -0.3783 + 1.1438 = 0.765).

Bu cədvəldəki dəyərlərdən istifadə edərək modelimiz üçün nisbi nisbət fərziyyəsinin məqbul olub olmadığını qiymətləndirə bilərik. (Diqqət edin, cədvəl həm aşağıda, həm də yuxarıda göstərilmişdir.) Məsələn, "yox" a bərabər olduqda, ikidən çox və ya bərabər və üçdən böyük və ya bərabər tətbiq üçün proqnozlaşdırılan dəyər arasındakı fərq təxminən olur. 2 (-0.378 --2.440 = 2.062). "Bəli" ilə bərabər olan ikiyə bərabər və ya üçdən böyük və ya bərabər tətbiq üçün proqnozlaşdırılan dəyərlərdəki fərq də təxminən 2 -dir (0.765 --1.347 = 2.112). Bu, paralel yamacların fərziyyəsinin ağlabatan olduğunu göstərir (bu fərqlər aşağıdakı qrafikin qurduğu şeydir). Bir proqnozlaşdırıcı dəyişən olaraq ictimaiyyətlə birlikdə proqnozlara diqqət yetirərək,görürük ki, ictimaiyyət "yox" olaraq təyin olunduqda, ikidən böyük və ya bərabər tətbiq üçün proqnozlardakı fərqin, üçdən böyük və ya bərabərinə nisbətlə təxminən 2.14 (-0.204 --2.345 = 2.141) olduğunu görürük. İctimaiyyət "bəli" olaraq təyin edildikdə, əmsallar arasındakı fərq təxminən 1.37 (-0.175 --1.547 = 1.372) təşkil edir. İki əmsal dəsti arasındakı məsafə fərqləri (2.14 vs 1.37) paralel yamaclar fərziyyəsinin proqnozlaşdırıcı ictimaiyyət üçün uyğun olmadığını düşündürə bilər. Bu, "qeyri -mümkün" dən "bir qədər ehtimala" və "bir qədər ehtimal olunan" dan "çox ehtimala" keçid üçün dövlət və özəl məktəbə getməyin təsirinin fərqli olduğunu göstərir.175 --1.547 = 1.372). İki əmsal dəsti arasındakı məsafə fərqləri (2.14 vs 1.37) paralel yamaclar fərziyyəsinin proqnozlaşdırıcı ictimaiyyət üçün uyğun olmadığını düşünə bilər. Bu, "qeyri -mümkün" dən "bir qədər ehtimala" və "bir qədər ehtimal olunan" dan "çox ehtimala" keçid üçün dövlət və özəl məktəbə getməyin təsirinin fərqli olduğunu göstərir.175 --1.547 = 1.372). İki əmsal dəsti arasındakı məsafə fərqləri (2.14 vs 1.37) paralel yamaclar fərziyyəsinin proqnozlaşdırıcı ictimaiyyət üçün uyğun olmadığını düşünə bilər. Bu, "qeyri -mümkün" dən "bir qədər ehtimala" və "bir qədər ehtimal olunan" dan "çox ehtimala" keçid üçün dövlət və özəl məktəbə getməyin təsirinin fərqli olduğunu göstərir.

Aşağıdakı süjet əmri R -ə, qurmaq istədiyimiz obyektin s olduğunu bildirir. = 1: 3 olan y səviyyələrini göstərən dəyərlərin siyahısı olan əmr süjetə daxil edilməlidir. Bağımlı dəyişəninizin üçdən çox səviyyəsi olsaydı, 3 -ü sayına dəyişmək lazımdırkateqoriyalar (məsələn, 0, 1, 2, 3 saylı olsa belə, dörd kateqoriya dəyişən üçün 4). Pch = 1: 3 əmri istifadə ediləcək markerləri seçir və x-oxunu etiketləyən xlab = 'logit' və qrafikin əsas etiketini boş olaraq təyin edən main = '' kimi isteğe bağlıdır. Oransal nisbət fərziyyəsi varsa, hər bir dəyişən üçün asılı dəyişənin hər bir kateqoriyası üçün simvollar arasındakı məsafə oxşar olaraq qalmalıdır. Bunu nümayiş etdirmək üçün bütün ilk əmsal dəstini sıfıra çevirdik, beləliklə ortaq bir istinad nöqtəsi var. Dəyişən dəyişən üçün əmsallara baxanda görürük ki, iki əmsal dəsti arasındakı məsafə oxşardır. Əksinə, ictimaiyyət üçün təxminlər arasındakı məsafələr fərqlidir (yəni markerlər ikinci sətirdə birincisindən daha çox fərqlənir),mütənasib nisbət fərziyyəsinin tutula bilməyəcəyini göstərir.

Modelimizin fərziyyələrinin doğru olub olmadığını qiymətləndirdikdən sonra, ümumiyyətlə əmsallardan və ya əmsal nisbətlərindən daha asan başa düşülən proqnoz ehtimalları əldə edə bilərik. Məsələn, hər bir ayrılmış və ictimai səviyyəsi üçün gpa dəyişə bilərik və hər bir tətbiq kateqoriyasında olma ehtimalını hesablaya bilərik. Proqnozlaşdırmaq üçün istifadə ediləcək bütün dəyərlərin yeni bir verilənlər bazası yaradaraq bunu edirik.

İndi məlumatları reshape2 paketi ilə uzun müddət dəyişə bilərik və fərqli şərtlər üçün proqnozlaşdırılan ehtimalların hamısını qura bilərik. Nəticə səviyyəsinə görə rənglənmiş bir xətt ilə əlaqəli proqnozlaşdırılan ehtimalları qururuq və tətbiq olunan və ictimaiyyət səviyyəsinə görə yönləndiririk. Süjetin hər bir sütununun və satırının nəyi təmsil etdiyini göstərən daha aydın etiketlər əlavə etmək üçün xüsusi etiket funksiyasından da istifadə edirik.