Có phải về mặt kỹ thuật là hợp lệ và phù hợp với hồi quy logistic với biến phụ thuộc là tỷ lệ không?


8

Một số bài đăng ( ở đâyở đây ) đề xuất rằng hồi quy beta là phù hợp hơn khi biến phụ thuộc được giới hạn tự nhiên trong khoảng từ 0 đến 1. Câu hỏi của tôi là bỏ sự phù hợp sang một bên, liệu về mặt kỹ thuật có phù hợp với hồi quy logistic với biến phản ứng tỷ lệ không? R sẽ đưa ra một cảnh báo nhưng vẫn tạo ra một kết quả.

Dường như với tôi rằng hàm khả năng sẽ không phải là một khả năng hợp lệ khi biến trả lời tỷ lệ thay vì nhị phân, nhưng về mặt toán học, nó vẫn có thể được giảm thiểu để đưa ra giải pháp. Tôi tự hỏi những gì vi phạm / sai lầm, nếu có, được thực hiện khi phù hợp với hồi quy logistic với dữ liệu tỷ lệ.


Ngoài các câu trả lời dưới đây: Đây là một bài viết khác liên quan đến câu hỏi này.
COOLSerdash

Câu trả lời:


8

Những gì bạn đề xuất đôi khi được gọi là một logit phân đoạn. Nó chắc chắn có giá trị của nó, miễn là bạn nhớ sử dụng các lỗi tiêu chuẩn mạnh mẽ. Vào năm 2010, tôi đã nói chuyện tại cuộc họp Người dùng Stata của Đức so sánh giữa những thứ khác với hồi quy beta và logit phân đoạn. Các slide có thể được tìm thấy ở đây: http://www.maartenbuis.nl/presentations/berlin10.pdf


(+1) Maarten, một câu hỏi khác: Tôi đọc rằng GLM nhị thức có thể được sử dụng cho các phản ứng phân số / tỷ lệ nếu tổng số thử nghiệm được cung cấp cho từng phân số / tỷ lệ (trong R điều này được thực hiện với một weightsđối số glm), xem ví dụ tại đây thống kê.stackexchange.com/a/26779/28666 . Làm thế nào "logit phân đoạn" với "lỗi tiêu chuẩn mạnh" liên quan đến phương pháp này? Có phải điều tương tự hay không?
amip

2
@amoeba thì khác. Hãy nghĩ về một logit phân đoạn như một mô hình cho tỷ lệ trung bình, trong khi những gì bạn đề xuất như là một cách để phục hồi mô hình logit.
Maarten Buis

6

Các mô hình loại này thường được định nghĩa và sử dụng như một loại mô hình tuyến tính tổng quát. Để có một đánh giá súc tích, hãy xem http://www.stata-journal.com/article.html?article=st0147 Đối số là nhị thức là một gia đình hợp lý ngay cả đối với tỷ lệ liên tục vì phương sai cũng sẽ tiếp cận 0 khi phương pháp trung bình hoặc 0 hoặc 1.

Cho dù các chương trình hoặc chức năng cụ thể trong phần mềm cụ thể chứa chúng là một vấn đề khác nhau. Để nói rằng "R sẽ đưa ra cảnh báo nhưng vẫn tạo ra kết quả" truyền tải ít thông tin. Bạn đang đề cập đến gói nào? Có thực sự là gói duy nhất có liên quan? Trong mọi trường hợp, như bài viết vừa tham chiếu chỉ ra, mô hình này được hỗ trợ tốt trong Stata, ví dụ.

Điều đó vẫn để lại phạm vi thảo luận chi tiết về giá trị tương đối của mô hình logit cho tỷ lệ liên tục và hồi quy beta.


1
+1 về câu trả lời cũ này sau khi thảo luận hôm nay ở nơi khác. Tôi vẫn sẽ khuyến khích bạn đăng câu trả lời về cách tiếp cận này trong stats.stackexchange.com/questions/29038 .
amip

1
Một số ý kiến ​​về cách thức này hoạt động trong R, ví dụ như trong các bình luận dưới câu trả lời này stats.stackexchange.com/a/43369 trong một chủ đề liên quan.
amip
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.