Giải thích đầu ra hồi quy logistic trong R


13

Tôi đang làm việc trên một hồi quy logistic nhiều trong R bằng cách sử dụng glm. Các biến dự đoán là liên tục và phân loại. Một trích dẫn của bản tóm tắt của mô hình cho thấy như sau:

Coefficients:
               Estimate Std. Error z value Pr(>|z|)
(Intercept)   2.451e+00  2.439e+00   1.005   0.3150
Age           5.747e-02  3.466e-02   1.658   0.0973 .
BMI          -7.750e-02  7.090e-02  -1.093   0.2743
...
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Khoảng tin cậy:

                  2.5 %       97.5 %
(Intercept)  0.10969506 1.863217e+03
Age          0.99565783 1.142627e+00
BMI          0.80089276 1.064256e+00
...

Tỷ lệ lẻ:

                 Estimate Std. Error   z value Pr(>|z|)
(Intercept)  1.159642e+01  11.464683 2.7310435 1.370327
Age          1.059155e+00   1.035269 5.2491658 1.102195
B            9.254228e-01   1.073477 0.3351730 1.315670
...

MộtgeMộtgeMộtgeMộtge


8
Nó chỉ có ý nghĩa ở mức độ tin cậy 10%, nhưng khoảng tin cậy là 5%.
Nick Sabbe

Vì vậy, khoảng tin cậy cho 10% sẽ không bao gồm 1 sau đó?
SabreWolfy

Giá trị p (bảng đầu tiên của cột cuối cùng) là cơ hội mà kết quả thu được hoặc tệ hơn sẽ đạt được nếu giả thuyết null là đúng. Khoảng tin cậy là một / khu vực sẽ giữ giá trị thực trong ví dụ 95% số lần. Nếu nó không giữ giá trị thực được giả thuyết, thì có nhiều khả năng 5% chúng ta sẽ nhận được kết quả thu được hoặc tệ hơn, nếu giả thuyết là đúng. Vì vậy, điều này sẽ ngụ ý giá trị p của bạn thấp hơn 5%. Có một mối quan hệ rất chặt chẽ giữa giá trị p và khoảng tin cậy (thống kê 101). Nhưng tóm lại: có, CI cho 10% sẽ bao gồm 1.
Nick Sabbe

Có vẻ như bạn đang giả định tuyến tính. Làm thế nào là hợp lý?
Frank Harrell

Câu trả lời:


8

Có một loạt các câu hỏi ở đây trên trang web sẽ giúp giải thích đầu ra của các mô hình (đây là ba ví dụ khác nhau, 1 2 3 và tôi chắc chắn có nhiều hơn nếu bạn tìm hiểu về kho lưu trữ). Đây cũng là một hướng dẫn trên trang web thống kê UCLA về cách diễn giải các hệ số cho hồi quy logistic.

Mặc dù tỷ lệ chênh lệch cho hệ số tuổi gần bằng một nhưng điều đó không nhất thiết có nghĩa là hiệu ứng là nhỏ (cho dù hiệu ứng là nhỏ hay lớn thường là một câu hỏi chuẩn mực như là một câu hỏi thực nghiệm). Người ta sẽ cần phải biết sự thay đổi điển hình về tuổi giữa các quan sát để đưa ra ý kiến ​​sáng suốt hơn.


Cảm ơn các liên kết đến hướng dẫn, có vẻ toàn diện. Tôi đã tìm kiếm ở đây trước khi đăng câu hỏi của tôi. Liên kết 1 và 3 dường như không liên quan đến câu hỏi của tôi.
SabreWolfy

@SabreWolfy, liên kết 1 làm sáng tỏ thêm cách giải thích các hệ số theo đơn vị ban đầu, liên kết 3 mô tả các bước để diễn giải các hiệu ứng theo xác suất (có thể áp dụng cho câu hỏi của bạn và các âm mưu được đề xuất trong câu hỏi đó sẽ là một phản ứng hợp lý với tôi nói rằng kích thước của hiệu ứng trực tiếp rất khó diễn giải mà không biết sự thay đổi về tuổi tác).
Andy W

5
(1.05930-1)×100%= =458%

Liên kết UCLA đã chết, nhưng liên kết này có thể tương ứng (ít nhất là nội dung của nó giúp tôi hiểu câu hỏi này).
MBR
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.