Từ exp ​​(hệ số) đến Tỷ lệ lẻ và cách giải thích của chúng trong Hồi quy logistic với các yếu tố


14

Tôi đã thực hiện một hồi quy tuyến tính về việc chấp nhận vào đại học so với điểm SAT và gia đình / dân tộc. Các dữ liệu là hư cấu. Đây là phần tiếp theo của một câu hỏi trước, đã được trả lời. Câu hỏi tập trung vào việc thu thập và giải thích tỷ lệ cược khi để điểm SAT sang một bên cho đơn giản.

Các biến là Accepted(0 hoặc 1) và Background("đỏ" hoặc "xanh"). Tôi thiết lập dữ liệu để những người có nền "đỏ" có nhiều khả năng truy cập hơn:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit)))

                        Odds_Ratio_RedvBlue             2.5 %       97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

Câu hỏi:

  1. Là 0,7 tỷ lệ lẻ của một người có nền "màu xanh" được chấp nhận? Tôi đang hỏi điều này bởi vì tôi cũng nhận được 0,7 cho " Backgroundblue" nếu thay vào đó tôi chạy đoạn mã sau:

    fit <- glm(Accepted~Background-1, data=dat, family="binomial")
    exp(cbind(OR=coef(fit), confint(fit)))
  2. Không nên chấp nhận tỷ lệ chênh lệch của "màu đỏ" ( ) chỉ là đối ứng: ( O d d s B l u e = 1 / O d d s R e d )?Mộtccepted/Red:Mộtccepted/BtôibạneÔiddSBtôibạne= =1/ÔiddSRed


1
Cái gì Rgọi một cách rõ ràng các hệ số (thông qua hàm coef) mà bạn đang gọi là "tỷ lệ cược" trong đầu ra của bạn. Điều đó cho thấy bạn có thể muốn xem lại sự khác biệt giữa hai điều này.
whuber

Tôi đã đọc bài viết trên siêu liên kết của bạn.
Antoni Parellada 3/2/2015

Các hệ số được lũy thừa: exp (coef (fit)).
Antoni Parellada 3/2/2015

Có: và như được giải thích trong câu trả lời của tôi trong chủ đề đó, lũy thừa của phần chặn cung cấp cho bạn tỷ lệ cược của trường hợp tham chiếu.
whuber

Câu trả lời:


13

Tôi đã làm việc để trả lời câu hỏi của mình bằng cách tính toán tỷ lệ cược và tỷ lệ cược theo cách thủ công:

Acceptance   blue            red            Grand Total
0            158             102                260
1            112             177                289
Total        270             279                549

Vì vậy, Tỷ lệ lẻ khi vào trường Red over Blue là:

ÔiddS Mộtccept Tôif RedÔiddS Mộtcccept Tôif Btôibạne= =177/102112/158= =1.73530,7089= =2.448

Và đây là sự Backgroundredtrở lại của:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(Odds_and_OR=coef(fit), confint(fit)))

                      Odds_and_OR                         2.5 %      97.5 %
(Intercept)             0.7088608                     0.5553459   0.9017961
Backgroundred           2.4480042                     1.7397640   3.4595454

(Intercept)112/158= =0,7089

Nếu thay vào đó, tôi chạy:

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(Odds=coef(fit2), confint(fit2)))

                        Odds            2.5 %      97.5 %
Backgroundblue     0.7088608        0.5553459   0.9017961
Backgroundred      1.7352941        1.3632702   2.2206569

Lợi nhuận chính xác là tỷ lệ nhận được 'màu xanh': Backgroundblue(0,7089) và tỷ lệ được chấp nhận là 'màu đỏ': Backgroundred(1.7353). Không có tỷ lệ lẻ ở đó. Do đó, hai giá trị trả về dự kiến ​​sẽ không có đi có lại.

Cuối cùng, Làm thế nào để đọc kết quả nếu có 3 yếu tố trong hồi quy phân loại?

Cùng một hướng dẫn so với tính toán [R]:

Tôi đã tạo một bộ dữ liệu giả tưởng khác nhau có cùng tiền đề, nhưng lần này có ba nền dân tộc: "đỏ", "xanh" và "cam" và chạy cùng một chuỗi:

Đầu tiên, bảng dự phòng:

Acceptance  blue    orange  red   Total
0             86        65  130     281
1             64        42  162     268
Total        150       107  292     549

Và tính toán các tỷ lệ cược nhận được cho mỗi nhóm dân tộc:

  • Tỷ lệ chấp nhận nếu màu đỏ = 1,246154;
  • Tỷ lệ chấp nhận nếu màu xanh = 0,744186;
  • Tỷ lệ chấp nhận nếu màu da cam = 0,646154

Cũng như các tỷ lệ cược khác nhau :

  • HOẶC đỏ v xanh = 1.674519;
  • HOẶC đỏ v cam = 1.928571;
  • HOẶC xanh v đỏ = 0,597186;
  • HOẶC màu xanh v cam = 1.151717;
  • HOẶC cam v đỏ = 0,518519; và
  • HOẶC màu cam v màu xanh = 0.868269

Và tiến hành hồi quy logistic thường quy theo sau là lũy thừa các hệ số:

fit <- glm(Accepted~Background, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit), confint(fit)))

                      ODDS     2.5 %   97.5 %
(Intercept)      0.7441860 0.5367042 1.026588
Backgroundorange 0.8682692 0.5223358 1.437108
Backgroundred    1.6745192 1.1271430 2.497853

Mang lại tỷ lệ cược khi tham gia "blues" là (Intercept), và Tỷ lệ Odds của Orange so với Blue in Backgroundorangevà OR của Red v Blue trong Backgroundred.

Mặt khác, hồi quy mà không bị chặn có thể dự đoán chỉ trả về ba tỷ lệ cược độc lập :

fit2 <- glm(Accepted~Background-1, data=dat, family="binomial")
exp(cbind(ODDS=coef(fit2), confint(fit2)))

                      ODDS     2.5 %    97.5 %
Backgroundblue   0.7441860 0.5367042 1.0265875
Backgroundorange 0.6461538 0.4354366 0.9484999
Backgroundred    1.2461538 0.9900426 1.5715814

Xin chúc mừng, bạn đã làm một công việc tốt đẹp để tìm ra điều này.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.