Tôi có một số dữ liệu trong [0,1] mà tôi muốn phân tích với hồi quy beta. Tất nhiên một cái gì đó cần phải được thực hiện để chứa 0,1 giá trị. Tôi không thích sửa đổi dữ liệu để phù hợp với một mô hình. Ngoài ra, tôi không tin rằng lạm phát 0 và 1 là một ý tưởng hay vì tôi tin rằng trong trường hợp này, người ta nên coi 0 là giá trị dương rất nhỏ (nhưng tôi không muốn nói chính xác giá trị nào là phù hợp. Tôi tin rằng sẽ chọn các giá trị nhỏ như 0,001 và 0,999 và để phù hợp với mô hình bằng cách sử dụng dist tích lũy cho phiên bản beta. Vì vậy, đối với các quan sát y_i khả năng đăng nhập LL_iwould là
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
Điều tôi thích ở mô hình này là nếu mô hình hồi quy beta hợp lệ thì mô hình này cũng hợp lệ, nhưng nó loại bỏ một chút độ nhạy đối với các giá trị cực trị. Tuy nhiên, đây dường như là một cách tiếp cận tự nhiên đến nỗi tôi tự hỏi tại sao tôi không tìm thấy bất kỳ tài liệu tham khảo rõ ràng nào trong tài liệu. Vì vậy, câu hỏi của tôi là thay vì sửa đổi dữ liệu, tại sao không sửa đổi mô hình. Sửa đổi dữ liệu làm sai lệch kết quả (dựa trên giả định rằng mô hình ban đầu là hợp lệ), trong khi sửa đổi mô hình bằng cách đánh dấu các giá trị cực trị không làm sai lệch kết quả.
Có lẽ có một vấn đề tôi đang xem xét?