Niyə 'Bir Vahid Artırılır' demək Logistika Reqressiyasında işləmir

Xülasə: Logistik reqressiya, log odds olan əmsallar yaradır. Katsayıları nisbətdə əldə etmək üçün e nisbətini yüksəldin. Oran hər bir vahid artımı üçün xətti bir artımdan daha çox eksponensial bir artıma malikdir. X -də iki ədəd artım, əmsal əmsalından bir kvadrat artımla nəticələnir. Bir ehtimal əldə etmək üçün X / (1 + X) logistik funksiyasından istifadə edərək proqnozlaşdırılan əmsalları qoyursunuz.

Logistik Reqressiya, Logistik funksiya daxilində xətti tənliyi istifadə etməsi ilə Xətti Reqressiya ilə əlaqədardır.

Onları eyni şəkildə şərh etmək cazibədardır, amma hər 102 sinif statistikası bunu bacarmayacağını söyləyəcək! Logistika geriləməsində nələrin baş verdiyini və əmsalları daha yaxşı şərh etməyi daha yaxşı başa düşməyi özümə götürdüm. İris məlumat dəstini və sürətli bir R proqramını istifadə edərək, log odds, odds və ehtimal arasındakı fərqləri göstərəcəyəm. Tam açıqlama üçün kifayət qədər anlayış toplamaq üçün üç dərslik və ən az 12 veb səhifəni açmalı oldum. Aşağıda ən çox sevdiyim səhifələrə bağlantılar.

Məlumatların qurulması

İlk addımda iris məlumat dəstini yükləməli və növ dəyişənini ikili hala gətirməliyik. Multinomial logistik reqressiya edə bilərik, lakin bu onu daha da tamamlayır və log odds, odds və ehtimallar arasındakı fərqi izah etməyə kömək etmir.

R -də bir logistik reqressiya modeli yaratmaq üçün glm funksiyasından və binomial ailədən istifadə edirsiniz. Nəhayət, data.frame -də bir sıra ardıcıllığı yaradılır. Bu ardıcıllıq, model ehtimallarının, ehtimalların və ehtimalların arxasında baş verənlərin tam spektrini görmək üçün modelin proqnozlaşdıracağı bütün dəyərlər olacaq.

Giriş Oran

  • Logistika reqressiya əmsalları log oddsdur.
  • Necə ki, reqressiyada olduğu kimi, giriş dəyişənini bir vahid artırdığınız zaman, log əmsalları bir vahid artır
  • Hər bir məlumat nöqtəsi arasındakı fərq (sağ sahə) əmsalla eynidir.

Proqnozlaşdırma funksiyası sadəcə test_data data.frame dəyərlərimizi alır və öyrənilən logistik reqressiya düsturuna daxil edir. $ Əmsallarından istifadə edərək model əmsallarını görə bilərsiniz.

Günlük nisbətləri ilə rahatsınızsa, daha çox getməyin! Günlük nisbətlərində bir vahid artımın menecerinizə nə demək olduğunu izah edə bilsəniz, hamısı buradadır. Hələ də köməyə ehtiyacı olanlar üçün oxuyun.

  • 'Oranlar' odds dəyərini qeyd etmək üçün qaldırılan e (euler sayı) dir.
  • Kollec cəbrini xatırlayırsınızsa: e^(log (x)) = x
  • Yuxarıdakı süjetlərdən görə bilərsiniz ki, Sepal genişliyi artdıqca Setosa olma ehtimalı da artır.
  • Fərqli süjet fərqli bir nümunə göstərmir, çünki sürətlə artan bir eksponensial trenddir.

Bu nümunədə, bahis hər bir qeyri-setosa üçün bu sepal enində görünən # setosa sayı kimi şərh olunur. Logistika reqressiyası, məhdudiyyətli bir dəyər almadığı üçün (məsələn, sıfır ilə bir arasında) nisbətləri / günlük nisbətlərini təxmin edir. Nümunədə bunu söyləmək çətindir, ancaq izləyirsinizsə, 3.3 sepal genişliyində şansın birdən çox olduğunu görəcəksiniz.

  • 1 -dən az olan nisbətlər, müstəqil və asılı dəyişənlər arasında mənfi bir əlaqə olduğunu göstərir. (Pr 0.5)

Davamlı bir dəyişkəndə əmsalların təfsirini daha yaxşı başa düşmək üçün, eksponentləşdirilmiş sepal genişlik əmsalına və 11 -ci (1.1) və 1 -ci (0.1) əmsal proqnozunun hissəsinə baxa bilərik. Onlar eynidir. Bəs niyə?

Davamlı bir dəyişən üçün, X dəyişənində hər bir vahid artımı üçün nisbi və eksponensial təsir var.

  • Şans nisbidir, buna görə müqayisə etmək üçün bir təməl xətt lazımdır.
  • Sepal genişlikdə = 2 nisbətinin 0.00215565 olduğunu və eksponentləşdirilmiş əmsalın 120.2574 olduğunu bilsəydiniz…
    • Sepal genişliyi = 3 -də deyə bilərsiniz, bahislərin sepal.width = 2 ilə müqayisədə setosa olma ehtimalı 122.2574 dəfə çoxdur.
    • Sepal eni 3 -də əmsal 0,2592329 -a bərabərdir və 0.00215565 * 120.2574 -ə bərabərdir.
    • Bölmə eni 4 -də 3 -cügenişlikdən 120.2574 dəfə böyükdür, lakin eni 2 -dən 120.2574 kvadrat (14461.85) dəfə çoxdur.
    • Bunun tənliyi belə görünə bilər: Base_Odds (i) * Odds_Coefficient^(ki) | yuxarıdakı nümunədə k 4, i 2 olardı.

    Beləliklə, əmsalları şərh edəcəksinizsə, sepal genişliyində bir vahid artım olduğunu söyləməlisiniz.

    İn 4.79 artım log bahisvə ya a

    120.26 setosa olma ehtimalınınartması . Şəxsən, bu böyük dəyər rəqəmləri izah etməyi çətinləşdirir. 10 -dan az olan şanslar daha dadlı olardı - başınızı 4x böyük və 48x böyük ətrafında sarın; ikincisini başa düşmək çətindir. Bu vəziyyətdə, şərhi göstərmək üçün ortaq bir dəyər və bir vahid artımdan istifadə edə bilərəm.

    Bəlkə də hesabat vermək və hələ də şərh etmək üçün ən yaxşı sahə ehtimaldır.

    Ehtimal

    • Ehtimal logistik və ya "logit" funksiyasına daxil olaraq hesablanır
    • Düstur… x / (1 + x)olduğu halda x müəyyən bir təkdir.
    • Ümumiləşdirilmiş Xətti Model baxımından bu, bir binomial paylanma üçün kanonik bağlantı funksiyasıdır.
    • Ehtimalların sigmoid / logistik əyrini (sol sahə) necə izlədiyinə və sıfır ilə bir arasında necə bağlı olduğuna diqqət yetirin.
    • Fərqlərə əsaslanaraq, logistik əyrinin mərkəzinə yaxınlaşdıqca necə sürətlə artdığını görə bilərsiniz (

    Type = 'cavab' parametri və arqumentdən istifadə etsəniz, proqnozlaşdırma funksiyasının bütün ehtimalları azaltmaq üçün bu işi görəcəyini qeyd etmək vacibdir. Ailənin binomial olduğunu və logitin standart bağlantı olduğunu elan etdiyimiz üçün proqnozlaşdırma funksiyası logit bağlantı funksiyasından istifadə etməyi bilir. Bunu $ family modeli ilə yoxlaya bilərsiniz. Proqnozu istifadə etmək, bütün riyazi hesablamaları özünüz etməkdən daha rahatdır.

    Budur bizdə! Günlük əmsal əmsallarından, nisbətlərə (euler nömrəsini istifadə edərək), ehtimallara (logistik / logit / link funksiyasından istifadə edərək) keçdik. İnşallah indi yadda saxlaya bilərsiniz ki, logistik reqressiya əmsallarını şərh edərkən ...

    • Oranı exp (model $ əmsalları) əldə etmək üçün e -ni odds əmsalına qaldırın.
    • Oranları eksponensial bir tendensiya kimi şərh edin.
    • Sepal genişliyi = 2 -nin, sepal genişliyi = 1 -dən 120 qat daha yüksək nisbətlərə sahib olduğunu söyləyin.
    • Bəzi ehtimallar gətirin. Misal üçün:
      • Sepal genişliyi = 1, setosa olma ehtimalının 0,00% -dən azdır.
      • sepal eni 3.3 -də setosa olma ehtimalı 52% -dir.

      Əlavə Oxu və Tam Kod

      Əlavə şərhlərlə maraqlananlar üçün tapdığım ən faydalı səhifələrdən bəziləri:

        Statistika Həllindən FOM Universitetindən Sebastian Sauerin Klinik Tədqiqat məlumat bazasından Analysis Factor blogundan.

      Bu nəticələri yenidən yaratmaqla maraqlanırsınızsa, süjetlər də daxil olmaqla tam kod budur.