Ý nghĩa của dự báo phân loại trong hồi quy logistic

Tôi gặp khó khăn trong việc diễn giải các giá trị z cho các biến phân loại trong hồi quy logistic. Trong ví dụ dưới đây, tôi có một biến phân loại với 3 lớp và theo giá trị z, Class2 có thể có liên quan trong khi các lớp khác thì không.

Nhưng bây giờ điều này có nghĩa là gì?

Rằng tôi có thể hợp nhất các lớp khác thành một?
Rằng toàn bộ biến có thể không phải là một dự đoán tốt?

Đây chỉ là một ví dụ và các giá trị z thực tế ở đây không phải từ một vấn đề thực sự, tôi chỉ gặp khó khăn về cách giải thích của họ.

           Estimate    Std. Error  z value Pr(>|z|)    
CLASS0     6.069e-02  1.564e-01   0.388   0.6979    
CLASS1     1.734e-01  2.630e-01   0.659   0.5098    
CLASS2     1.597e+00  6.354e-01   2.514   0.0119 *

— người dùng695652
nguồn

Câu trả lời:

Giải thích sau đây không giới hạn ở hồi quy logistic mà áp dụng như nhau trong hồi quy tuyến tính thông thường và các GLM khác. Thông thường, Rloại trừ một cấp độ phân loại và hệ số biểu thị sự khác biệt của từng lớp đối với lớp tham chiếu này (hoặc đôi khi được gọi là lớp cơ sở) (đây được gọi là mã hóa giả hoặc tương phản điều trị R, xem ở đây để biết tổng quan tuyệt vời về các tùy chọn tương phản khác nhau ). Để xem sự tương phản hiện tại trong R, gõ options("contrasts"). Thông thường, sắp Rxếp các mức của biến phân loại theo thứ tự abc và lấy đầu tiên làm lớp tham chiếu. Điều này không phải lúc nào cũng tối ưu và có thể được thay đổi bằng cách gõ (ở đây, chúng tôi sẽ đặt lớp tham chiếu thành "c" trong biến mới)new.variable <- relevel(old.variable, ref="c") $z$ $p$ anova(model1, model2, test="LRT")R

mydata <- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")

mydata$rank <- factor(mydata$rank)

my.mod <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial")

summary(my.mod)

Coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept) -3.989979   1.139951  -3.500 0.000465 ***
gre          0.002264   0.001094   2.070 0.038465 *  
gpa          0.804038   0.331819   2.423 0.015388 *  
rank2       -0.675443   0.316490  -2.134 0.032829 *  
rank3       -1.340204   0.345306  -3.881 0.000104 ***
rank4       -1.551464   0.417832  -3.713 0.000205 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

rank1rankrank1rankrank1rank2 $-0.675$ rank1rank2 $-3.99 - 0.675 = -4.67$ rank1rank1. Bạn cũng có thể điều chỉnh mô hình mà không bị chặn bằng cách thêm - 1vào công thức mô hình để xem trực tiếp tất cả các hệ số:

my.mod2 <- glm(admit ~ gre + gpa + rank - 1, data = mydata, family = "binomial")

summary(my.mod2) # no intercept model

Coefficients:
       Estimate Std. Error z value Pr(>|z|)    
gre    0.002264   0.001094   2.070 0.038465 *  
gpa    0.804038   0.331819   2.423 0.015388 *  
rank1 -3.989979   1.139951  -3.500 0.000465 ***
rank2 -4.665422   1.109370  -4.205 2.61e-05 ***
rank3 -5.330183   1.149538  -4.637 3.54e-06 ***
rank4 -5.541443   1.138072  -4.869 1.12e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Lưu ý rằng việc đánh chặn đã biến mất ngay bây giờ và hệ số rank1chính xác là đánh chặn của mô hình đầu tiên. Ở đây, kiểm tra Wald kiểm tra không phải sự khác biệt theo cặp giữa các hệ số mà là giả thuyết rằng mỗi hệ số riêng lẻ bằng không. Một lần nữa, chúng tôi có bằng chứng rằng mọi hệ số rankkhác 0. Cuối cùng, để kiểm tra xem toàn bộ biến có rankcải thiện sự phù hợp của mô hình hay không, chúng ta khớp một mô hình với ( my.mod1) và một mô hình không có biến rank( my.mod2) và tiến hành kiểm tra tỷ lệ khả năng. Điều này kiểm tra giả thuyết rằng tất cả các hệ số rankbằng không:

my.mod1 <- glm(admit ~ gre + gpa + rank, data = mydata, family = "binomial") # with rank
my.mod2 <- glm(admit ~ gre + gpa, data = mydata, family = "binomial") # without rank

anova(my.mod1, my.mod2, test="LRT")

Analysis of Deviance Table

Model 1: admit ~ gre + gpa + rank
Model 2: admit ~ gre + gpa
  Resid. Df Resid. Dev Df Deviance  Pr(>Chi)    
1       394     458.52                          
2       397     480.34 -3  -21.826 7.088e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Kiểm tra tỷ lệ khả năng là rất quan trọng và chúng tôi sẽ kết luận rằng biến ranknên vẫn còn trong mô hình.

Bài này cũng rất thú vị.

— COOLSerdash
nguồn

Câu trả lời rất nhiều thông tin! Một câu hỏi nhanh: nếu chúng ta chỉ có thứ hạng là người dự đoán thì sao? Để thực hiện kiểm tra LRT, null sẽ là admit ~ 1vs admit ~ rank - 1?

— NULL

@NULL Có, hoặc null so với admit~rankhoặc admit~rank - 1, chúng tương đương với sự phù hợp.

— COOLSerdash

Cảm ơn rất nhiều! Một câu hỏi nhanh khác: khi tôi quan tâm đến việc thực hiện kiểm tra Wald một lần về các hệ số của biến phân loại (không so sánh với đường cơ sở - ý tôi là không có đánh chặn), liệu tác động của các yếu tố dự đoán khác như grevà gpacó bị ảnh hưởng bởi sự thiếu này không bao gồm đánh chặn?

— NULL

Nói cách khác, nếu tôi muốn thực hiện kiểm tra một đầu về các hệ số của yếu tố dự đoán phân loại trong khi kiểm soát các hiệp phương sai khác, đây có phải là cách để đi không? và điều này cũng sẽ được áp dụng cho hồi quy tuyến tính?

— NULL

rankrank

p

$p$

Các $z$ -value chỉ là thống kê kiểm tra cho kiểm tra thống kê, vì vậy nếu bạn gặp khó khăn trong việc diễn giải nó, bước đầu tiên của bạn là tìm hiểu giả thuyết null là gì. Giả thuyết khống cho bài kiểm tra cho Class0 là hệ số của nó là 0. Hệ số cho Class0 là sự khác biệt về log (tỷ lệ cược) giữa Class0 và lớp tham chiếu (Class3?) Là 0, hoặc tương đương, tỷ lệ của tỷ lệ cược cho Class0 và lớp tham chiếu là 1. Nói cách khác, không có sự khác biệt về tỷ lệ thành công giữa Class0 và lớp tham chiếu.

Vì vậy, một hệ số không đáng kể có nghĩa là bạn có thể hợp nhất các danh mục? Không. Thứ nhất, không có nghĩa là chúng ta không thể bác bỏ giả thuyết rằng không có sự khác biệt, nhưng điều đó không có nghĩa là không có sự khác biệt nào như vậy tồn tại. Việc không có bằng chứng không giống như bằng chứng vắng mặt. Thứ hai, các thể loại hợp nhất, đặc biệt là thể loại tham chiếu, thay đổi cách hiểu của tất cả các hệ số khác. Điều đó có hợp lý hay không phụ thuộc vào những gì các lớp khác nhau đại diện.

Điều đó có nghĩa là toàn bộ biến phân loại là một yếu tố dự đoán "xấu" (không đáng kể)? Không, vì điều đó bạn sẽ cần phải thực hiện kiểm tra đồng thời cho tất cả các thuật ngữ LỚP.

— Maart Buis
nguồn