Khoảng dự đoán cho kết quả của hồi quy logistic với đáp ứng nhị thức


8

Giả sử chúng ta có một mô hình hồi quy logistic:

P(y=1|x)=plog(p1p)=βx

Cho một mẫu ngẫu nhiên có kích thước , chúng ta có thể tính các khoảng tin cậy cho và các khoảng dự đoán tương ứng cho , với một giá trị nhất định của vectơ dự đoán. Đây là tất cả rất chuẩn và chi tiết, ví dụ, ở đây .N β p x *D={X,y}Nβpx

Thay vào đó, giả sử rằng tôi quan tâm đến một khoảng dự đoán cho , được đưa ra . Tất nhiên, hoàn toàn không có ý nghĩa gì khi tính một khoảng dự đoán cho một lần thực hiện , bởi vì chỉ có thể lấy các giá trị 0 và 1, và không có giá trị nào ở giữa. Tuy nhiên , nếu chúng tôi xem xét nhận ra cho cùng một giá trị cố định của , thì điều này trở nên tương tự (nhưng không giống nhau) với câu hỏi tính toán khoảng dự đoán cho biến ngẫu nhiên nhị thức . Về cơ bản, đây là tình huống tương tự được mô tả bởi Glen_b trong các bình luận cho câu trả lời nàyx * y y m y x *yxyymyx. Câu hỏi này có câu trả lời không, ngoài câu hỏi nhỏ "sử dụng bootstrap không theo tỷ lệ"?


thay vào đó, bạn có thể tính một khoảng dự đoán cho không? log(p/(1p))
Hugh Perkins

2
@HughPerkins Tôi nghĩ rằng vấn đề là làm thế nào để kết hợp độ không đảm bảo trong p với độ không đảm bảo trong lấy mẫu nhị thức cũng cho độ không đảm bảo trong p . Có một giải pháp dạng đóng?
EdM

@EdM bạn có quan điểm của tôi. Tôi tự hỏi nếu có một giải pháp dạng đóng hoặc một xấp xỉ phân tích.
DeltaIV

1
[offtopic] ý tưởng ngẫu nhiên, với tôi, thật thú vị khi có một thẻ như 'cơ hội nghiên cứu mở' cho những câu hỏi như thế này / nếu chúng được trả lời theo cách tiêu cực
Hugh Perkins

Câu trả lời:


4

Một cách này sẽ hoạt động mà không cần bootstrapping (trong thực tế có thể là điều nhanh nhất thực hiện), sẽ là:

  1. Giả sử rằng một xấp xỉ bình thường cho tỷ lệ cược log dự đoán ( ) cộng / trừ lỗi tiêu chuẩn của nó hoạt động. Bất kỳ phần mềm hồi quy logistic sẽ cung cấp điều này.xβ^
  2. Phần trăm của phân phối này biến đổi thành xác suất thông qua chống logit.
  3. Người ta có thể tìm thấy (hỗn hợp) phân phối beta gần đúng với phân phối dự đoán cho xác suất tốt.
  4. Phân phối dự đoán cho kết quả sau đó là (phân phối) phân phối nhị thức beta (s có cùng trọng số trộn như được sử dụng trong bước 3).

Ngoài ra, người ta có thể "chỉ" tích hợp các tỷ lệ cược log từ dự đoán chung về kết quả và tỷ lệ cược log, nhưng tôi tin rằng đó sẽ là một mớ hỗn độn hoàn toàn không có giải pháp dạng đóng.


4
Bạn cũng có thể chỉ mô phỏng trực tiếp từ đa biến tiệm cận bình thường cho , sau đó tạo thành một hỗn hợp các nhị thức trên các giá trị đó. ββ^
Glen_b -Reinstate Monica

Tôi thích ý tưởng tổng thể, nhưng tôi không chắc về chi tiết. Ví dụ: "tìm (một hỗn hợp) phân phối beta gần đúng với phân phối dự đoán cho xác suất tốt", làm thế nào để bạn thực hành điều này? Bạn có thể thêm một ví dụ? Ngay cả một chiều thấp cũng đủ.
DeltaIV

3
Tôi có thể viết nó lên như một câu trả lời dưới dạng câu trả lời nếu bạn thích - tôi cũng không bận tâm.
Glen_b -Reinstate Monica

2
@Glen_b Tôi thực sự đánh giá cao điều đó.
DeltaIV

1
@Glen_b, tôi sẽ thích thú khi thấy câu trả lời đó.
Richard Hardy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.