Hồi quy beta (nghĩa là GLM với phân phối beta và thường là hàm liên kết logit) thường được đề xuất để xử lý phản hồi hay còn gọi là biến phụ thuộc lấy các giá trị từ 0 đến 1, chẳng hạn như phân số, tỷ lệ hoặc xác suất: Hồi quy cho kết quả (tỷ lệ hoặc phân số) từ 0 đến 1 .
Tuy nhiên, người ta luôn khẳng định rằng hồi quy beta không thể được sử dụng ngay khi biến phản hồi bằng 0 hoặc 1 ít nhất một lần. Nếu đúng như vậy, người ta cần sử dụng mô hình beta zero / one-thổi phồng hoặc thực hiện một số chuyển đổi của phản hồi, v.v.: Hồi quy Beta của dữ liệu tỷ lệ bao gồm 1 và 0 .
Câu hỏi của tôi là: thuộc tính nào của phân phối beta ngăn chặn hồi quy beta xử lý các 0 và 1 chính xác, và tại sao?
Tôi đoán rằng và 1 không hỗ trợ phân phối beta. Nhưng đối với tất cả các tham số hình dạng α > 1 và β > 1 , cả 0 và một đều hỗ trợ phân phối beta, chỉ dành cho các tham số hình dạng nhỏ hơn mà phân phối đi đến vô cùng ở một hoặc cả hai bên. Và có lẽ dữ liệu mẫu sao cho cả α và β cung cấp phù hợp nhất sẽ bật ra trên 1 .
Điều đó có nghĩa là trong một số trường hợp, trên thực tế người ta có thể sử dụng hồi quy beta ngay cả với số không / số không?
Tất nhiên ngay cả khi 0 và 1 hỗ trợ phân phối beta, xác suất quan sát chính xác 0 hoặc 1 là 0. Nhưng như vậy là xác suất để quan sát bất kỳ tập hợp giá trị có thể đếm được khác, vì vậy điều này không thể là một vấn đề, phải không? ( Nhận xét này của @Glen_b).
Trong bối cảnh suy thoái beta, phân phối phiên bản beta được tham số khác nhau, nhưng với nên vẫn được xác định rõ trên [ 0 , 1 ] cho tất cả μ .