Gần đây, tôi đã quan tâm đến việc thực hiện mô hình hồi quy beta, vì một kết quả là một tỷ lệ. Lưu ý rằng kết quả này sẽ không phù hợp với bối cảnh nhị thức, bởi vì không có khái niệm có ý nghĩa về một "thành công" riêng biệt trong bối cảnh này. Trong thực tế, kết quả thực sự là một tỷ lệ thời lượng; tử số là số giây trong khi một điều kiện nhất định được kích hoạt trên tổng số giây trong đó điều kiện đủ điều kiện để hoạt động. Tôi xin lỗi vì những điều mơ hồ, nhưng tôi không muốn tập trung quá nhiều vào bối cảnh chính xác này, bởi vì tôi nhận ra có nhiều cách để một quá trình như vậy có thể được mô hình hóa bên cạnh hồi quy beta, và bây giờ tôi quan tâm nhiều hơn đến lý thuyết những câu hỏi đã nảy sinh trong nỗ lực của tôi để thực hiện một mô hình như vậy (tất nhiên tôi là
Trong mọi trường hợp, tất cả các tài nguyên tôi có thể tìm thấy đã chỉ ra rằng hồi quy beta thường phù hợp bằng cách sử dụng liên kết logit (hoặc probit / cloglog) và các tham số được hiểu là thay đổi về tỷ lệ cược log. Tuy nhiên, tôi vẫn chưa tìm thấy một tài liệu tham khảo thực sự cung cấp bất kỳ lời biện minh thực sự nào về lý do tại sao một người muốn sử dụng liên kết này.
Bản gốc của Ferrari & Cribari-Neto (2004) không cung cấp lời biện minh; họ chỉ lưu ý rằng hàm logit là "đặc biệt hữu ích", do cách giải thích tỷ lệ chênh lệch của các tham số lũy thừa. Các nguồn khác ám chỉ mong muốn ánh xạ từ khoảng (0,1) đến dòng thực. Tuy nhiên, chúng ta có nhất thiết cần một hàm liên kết cho ánh xạ như vậy không, cho rằng chúng ta đã giả sử phân phối beta? Hàm liên kết cung cấp những lợi ích nào ở trên và ngoài các ràng buộc được áp đặt bằng cách giả sử phân phối beta bắt đầu bằng?Tôi đã chạy một vài mô phỏng nhanh và không thấy dự đoán ngoài khoảng (0,1) với liên kết nhận dạng, ngay cả khi mô phỏng từ các bản phân phối beta có khối lượng xác suất phần lớn gần bằng 0 hoặc 1, nhưng có lẽ mô phỏng của tôi chưa đủ chung để nắm bắt một số bệnh lý.
Đối với tôi, dường như dựa trên cách các cá nhân, trong thực tế, diễn giải các ước tính tham số từ các mô hình hồi quy beta (nghĩa là tỷ lệ chênh lệch) mà họ đang ngầm suy luận về tỷ lệ "thành công"; nghĩa là, họ đang sử dụng hồi quy beta để thay thế cho mô hình nhị thức. Có lẽ điều này phù hợp trong một số bối cảnh, dựa trên mối quan hệ giữa các bản phân phối beta và nhị thức, nhưng đối với tôi, đây có vẻ là một trường hợp đặc biệt hơn so với trường hợp chung. Trong câu hỏi này , một câu trả lời được đưa ra để diễn giải tỷ lệ chênh lệch liên quan đến tỷ lệ liên tục thay vì kết quả, nhưng dường như tôi không cần thiết phải cố gắng giải thích mọi thứ theo cách này, trái ngược với việc sử dụng nhật ký hoặc liên kết danh tính và giải thích% thay đổi hoặc thay đổi đơn vị.
Vậy, tại sao chúng ta sử dụng liên kết logit cho các mô hình hồi quy beta? Có phải nó chỉ đơn giản là một vấn đề thuận tiện, để liên hệ nó với các mô hình nhị thức?