Chức năng rời rạc: Bảo hiểm khoảng tin cậy?


9

Làm thế nào để tính phạm vi bảo hiểm khoảng cách rời rạc?

Những gì tôi biết làm thế nào:

Nếu tôi có một mô hình liên tục, tôi có thể xác định khoảng tin cậy 95% cho mỗi giá trị dự đoán của mình và sau đó xem tần suất các giá trị thực tế nằm trong khoảng tin cậy. Tôi có thể thấy rằng chỉ 88% thời gian mà khoảng tin cậy 95% của tôi bao gồm các giá trị thực tế.

Những gì tôi không biết làm thế nào:

Làm thế nào để tôi làm điều này cho một mô hình rời rạc, chẳng hạn như poisson hoặc gamma-poisson? Những gì tôi có cho mô hình này là như sau, thực hiện một quan sát duy nhất (trong số hơn 100.000 tôi dự định tạo :)

Quan sát #: (tùy ý)

Giá trị dự đoán: 1,5

Dự đoán xác suất 0: .223

Dự đoán xác suất 1: .335

Dự đoán xác suất 2: 0,251

Dự đoán xác suất 3: .126

Dự đoán xác suất 4: .048

Dự đoán xác suất 5: .014 [và 5 trở lên là .019]

...(Vân vân)

Xác suất dự đoán là 100 (hoặc với một số con số không thực tế khác): .000

Giá trị thực tế (một số nguyên như "4")

Lưu ý rằng trong khi tôi đã đưa ra các giá trị poisson ở trên, trong mô hình thực tế, giá trị dự đoán là 1,5 có thể có các xác suất dự đoán khác nhau là 0,1, ... 100 trên các quan sát.

Tôi bối rối bởi sự chênh lệch của các giá trị. "5" rõ ràng nằm ngoài khoảng 95%, vì chỉ có 0,05 ở mức 5 trở lên, nhỏ hơn 0,25. Nhưng sẽ có rất nhiều 4 người - cá nhân họ ở trong đó, nhưng làm cách nào để cùng nhau đánh giá số lượng 4 người một cách phù hợp hơn?

Sao tôi phải quan tâm?

Các mô hình tôi đang xem đã bị chỉ trích là chính xác ở cấp độ tổng hợp nhưng đưa ra dự đoán cá nhân kém. Tôi muốn xem các dự đoán cá nhân nghèo tệ đến mức nào so với các khoảng tin cậy rộng vốn có của mô hình. Tôi hy vọng phạm vi bảo hiểm theo kinh nghiệm sẽ tệ hơn (ví dụ: tôi có thể thấy 88% giá trị nằm trong khoảng tin cậy 95%), nhưng tôi hy vọng chỉ tệ hơn một chút.

Câu trả lời:


6

Khoảng tin cậy của Neyman không cố gắng cung cấp phạm vi bảo hiểm của tham số trong trường hợp của bất kỳ khoảng cụ thể nào. Thay vào đó, họ cung cấp bảo hiểm trên tất cả các giá trị tham số có thể trong thời gian dài. Theo một nghĩa nào đó, họ cố gắng để được chính xác toàn cầu với chi phí chính xác địa phương.

Khoảng tin cậy cho tỷ lệ nhị thức cung cấp một minh họa rõ ràng về vấn đề này. Đánh giá của Neymanian về các khoảng thời gian mang lại các ô bao phủ không đều như thế này, đó là cho các khoảng Clopper-Pearson 95% cho n = 10 thử nghiệm nhị thức:

Âm mưu bảo hiểm Clopper-Pearson

Có một cách khác để thực hiện bảo hiểm, một cách mà cá nhân tôi nghĩ là dễ tiếp cận hơn bằng trực giác và (do đó) hữu ích. Phạm vi bảo hiểm theo các khoảng có thể được chỉ định có điều kiện trên kết quả quan sát được. Bảo hiểm đó sẽ được bảo hiểm địa phương. Dưới đây là một biểu đồ cho thấy mức độ bao phủ cục bộ của ba phương pháp tính toán khoảng thời gian khác nhau cho tỷ lệ nhị thức: Clopper-Pearson, điểm của Wilson và một phương pháp chính xác có điều kiện tạo ra các khoảng giống hệt với khoảng Bayesian với một thống nhất trước đó:

Bảo hiểm có điều kiện cho ba loại khoảng

Lưu ý rằng phương pháp Clopper-Pearson 95% cho độ che phủ cục bộ hơn 98% nhưng các khoảng điều kiện chính xác là, chính xác.

Một cách nghĩ về sự khác biệt giữa các khoảng thời gian toàn cầu và cục bộ là coi toàn cầu là sự đảo ngược của các thử nghiệm giả thuyết Neyman-Pearson trong đó kết quả là một quyết định được đưa ra trên cơ sở xem xét tỷ lệ lỗi dài hạn cho hiện tại thử nghiệm như một thành viên của tập hợp toàn cầu của tất cả các thử nghiệm có thể được chạy. Các khoảng thời gian địa phương gần giống với đảo ngược các thử nghiệm có ý nghĩa Ngư nghiệp mang lại giá trị P đại diện cho bằng chứng chống lại null trong thí nghiệm cụ thể này .

(Theo như tôi biết, sự khác biệt giữa thống kê toàn cầu và địa phương lần đầu tiên được đưa ra trong một luận án thạc sĩ chưa được công bố của Claire F Leslie (1998) suy luận thống kê với tham chiếu cụ thể đến lý thuyết về khoảng tin cậy. Luận án đó được tổ chức bởi thư viện Baillieu tại Đại học Melbourne.)


2
Tôi không nghĩ Claire Leslie đã phát minh ra sự khác biệt toàn cầu / địa phương, nhưng cô ấy đã đưa ra một mô tả rất chi tiết về nó, với rất nhiều tài liệu tham khảo. Tôi quá đề nghị luận án của cô ấy.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.