Có sự khác biệt về chức năng giữa tỷ lệ chênh lệch và tỷ lệ nguy hiểm không?


10

Trong hồi quy logistic, tỷ lệ chênh lệch là 2 có nghĩa là sự kiện này có thể xảy ra gấp 2 lần với mức tăng một đơn vị trong công cụ dự đoán. Trong hồi quy Cox, tỷ lệ nguy hiểm là 2 có nghĩa là sự kiện sẽ xảy ra gấp đôi thường xuyên tại mỗi thời điểm với mức tăng một đơn vị trong công cụ dự đoán. Đây có phải là thực tế không giống nhau?

Vậy thì lợi thế khi thực hiện hồi quy Cox và nhận tỷ lệ rủi ro là gì nếu chúng ta có thể có được thông tin chức năng giống nhau từ tỷ lệ chênh lệch của hồi quy logistic?

Câu trả lời:


12

tỷ lệ chênh lệch là 2 có nghĩa là sự kiện này có thể xảy ra gấp 2 lần với mức tăng một đơn vị trong công cụ dự đoán

Nó có nghĩa là tỷ lệ cược sẽ tăng gấp đôi, không giống như xác suất nhân đôi.

Trong hồi quy Cox, tỷ lệ nguy hiểm là 2 có nghĩa là sự kiện sẽ xảy ra gấp đôi thường xuyên tại mỗi thời điểm với mức tăng một đơn vị trong công cụ dự đoán.

Bên cạnh một chút của handwaving, có - tỷ lệ xảy ra tăng gấp đôi. Nó giống như một xác suất tức thời được thu nhỏ.

Đây có phải là thực tế không giống nhau?

Chúng gần như giống nhau khi nhân đôi tỷ lệ cược của sự kiện gần giống như nhân đôi nguy cơ của sự kiện. Chúng không tự động tương tự nhau, nhưng trong một số trường hợp (khá phổ biến) chúng có thể tương ứng rất chặt chẽ.

Bạn có thể muốn xem xét sự khác biệt giữa tỷ lệ cược và xác suất cẩn thận hơn.

Xem, ví dụ, câu đầu tiên ở đây , cho thấy rõ rằng tỷ lệ cược là tỷ lệ của xác suất so với bổ sung của nó. Vì vậy, ví dụ: tăng tỷ lệ cược (có lợi) từ 1 lên 2 cũng giống như tăng xác suất từ lên . Tỷ lệ tăng nhanh hơn xác suất tăng. Đối với các xác suất rất nhỏ, tỷ lệ cược ủng hộ và xác suất rất giống nhau, trong khi tỷ lệ cược trở nên ngày càng giống với (theo nghĩa là tỷ lệ này sẽ là 1) đối ứng xác suất khi xác suất trở nên nhỏ. Tỷ lệ cược đơn giản là tỷ lệ của hai bộ tỷ lệ cược. Tăng tỷ lệ cược trong khi giữ hằng số tỷ lệ cược cơ sở tương ứng với việc tăng tỷ lệ cược khác, nhưng có thể hoặc không thể tương tự với thay đổi tương đối trong xác suất.1223

Bạn cũng có thể muốn suy nghĩ về sự khác biệt giữa nguy cơ và xác suất (xem cuộc thảo luận trước đây của tôi, nơi tôi đề cập đến việc vẫy tay; bây giờ chúng ta không đề cập đến sự khác biệt). Ví dụ: nếu xác suất là 0,6, bạn không thể nhân đôi nó - nhưng nguy cơ tức thời là 0,6 thể tăng gấp đôi lên 1,2. Chúng không giống nhau, theo cùng một cách mà mật độ xác suất không phải là xác suất.


2
+1 Chỉ cần bình luận để đề cập rằng một số dạng phân tích lịch sử sự kiện sử dụng định nghĩa khác về chức năng nguy hiểm (ví dụ: trong các mô hình lịch sử sự kiện thời gian rời rạc là xác suất xảy ra sự kiện tại thời điểm điều kiện xảy ra. trước thời điểm đó và như vậy sẽ không có ý nghĩa gì trong các mô hình như vậy). h(t)t2×0.6
Alexis

1
Cảm ơn, điều đó chắc chắn có liên quan. Điều này được kết nối với thực tế là một pmf rời rạc không thể vượt quá 1 trong khi mật độ chắc chắn có thể.
Glen_b -Reinstate Monica

3

Đây là một câu hỏi hay. Nhưng những gì bạn thực sự yêu cầu không nên là cách thống kê được diễn giải mà là những giả định làm cơ sở cho từng mô hình tương ứng của bạn (nguy hiểm hoặc hậu cần). Mô hình logistic là một mô hình tĩnh dự đoán hiệu quả khả năng xảy ra sự kiện tại một thời điểm cụ thể được cung cấp thông tin quan sát được. Tuy nhiên, mô hình nguy hiểm hoặc mô hình Cox là mô hình thời gian mô hình tỷ lệ sống theo thời gian. Bạn có thể hỏi một câu hỏi như "khả năng người sử dụng thuốc lá sống sót đến 75 tuổi là bao nhiêu so với người không sử dụng hồi quy logistic của bạn" (cho rằng bạn có thông tin về tỷ lệ tử vong cho một đoàn hệ đến 75 tuổi) . Nhưng nếu thay vào đó, bạn muốn tận dụng sự đầy đủ của chiều thời gian của dữ liệu thì sử dụng mô hình nguy hiểm sẽ phù hợp hơn.

Cuối cùng, mặc dù nó thực sự phù hợp với những gì bạn muốn làm người mẫu. Bạn có tin những gì bạn đang làm người mẫu là một sự kiện một lần? Sử dụng hậu cần. Nếu bạn tin rằng sự kiện của bạn có cơ hội cố định hoặc tỷ lệ xảy ra mỗi giai đoạn trong một phổ thời gian quan sát được? Sử dụng mô hình nguy hiểm.

Việc lựa chọn phương pháp không nên dựa trên cách bạn diễn giải thống kê. Nếu đây là trường hợp thì sẽ không có sự khác biệt giữa OLS, LAD, Tobit, Heckit, IV, 2SLS hoặc một loạt các phương pháp hồi quy khác. Thay vào đó, nó nên dựa trên hình thức mà bạn tin rằng mô hình cơ bản mà bạn đang cố ước tính.


-1 (Hỗn hợp) Các mô hình logistic chắc chắn có thể mô hình tỷ lệ sống theo thời gian. Xem ví dụ Allison, PD (1982). Phương pháp thời gian rời rạc để phân tích lịch sử sự kiện . Phương pháp luận xã hội học , 13 (1982), 61 bóng98, hoặc Allison, PD (1984). Phân tích lịch sử sự kiện: Hồi quy cho dữ liệu sự kiện theo chiều dọc (Tập 12). Sage Beverly Hills, CA.
Alexis
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.