Làm thế nào để tính phạm vi bảo hiểm khoảng cách rời rạc?
Những gì tôi biết làm thế nào:
Nếu tôi có một mô hình liên tục, tôi có thể xác định khoảng tin cậy 95% cho mỗi giá trị dự đoán của mình và sau đó xem tần suất các giá trị thực tế nằm trong khoảng tin cậy. Tôi có thể thấy rằng chỉ 88% thời gian mà khoảng tin cậy 95% của tôi bao gồm các giá trị thực tế.
Những gì tôi không biết làm thế nào:
Làm thế nào để tôi làm điều này cho một mô hình rời rạc, chẳng hạn như poisson hoặc gamma-poisson? Những gì tôi có cho mô hình này là như sau, thực hiện một quan sát duy nhất (trong số hơn 100.000 tôi dự định tạo :)
Quan sát #: (tùy ý)
Giá trị dự đoán: 1,5
Dự đoán xác suất 0: .223
Dự đoán xác suất 1: .335
Dự đoán xác suất 2: 0,251
Dự đoán xác suất 3: .126
Dự đoán xác suất 4: .048
Dự đoán xác suất 5: .014 [và 5 trở lên là .019]
...(Vân vân)
Xác suất dự đoán là 100 (hoặc với một số con số không thực tế khác): .000
Giá trị thực tế (một số nguyên như "4")
Lưu ý rằng trong khi tôi đã đưa ra các giá trị poisson ở trên, trong mô hình thực tế, giá trị dự đoán là 1,5 có thể có các xác suất dự đoán khác nhau là 0,1, ... 100 trên các quan sát.
Tôi bối rối bởi sự chênh lệch của các giá trị. "5" rõ ràng nằm ngoài khoảng 95%, vì chỉ có 0,05 ở mức 5 trở lên, nhỏ hơn 0,25. Nhưng sẽ có rất nhiều 4 người - cá nhân họ ở trong đó, nhưng làm cách nào để cùng nhau đánh giá số lượng 4 người một cách phù hợp hơn?
Sao tôi phải quan tâm?
Các mô hình tôi đang xem đã bị chỉ trích là chính xác ở cấp độ tổng hợp nhưng đưa ra dự đoán cá nhân kém. Tôi muốn xem các dự đoán cá nhân nghèo tệ đến mức nào so với các khoảng tin cậy rộng vốn có của mô hình. Tôi hy vọng phạm vi bảo hiểm theo kinh nghiệm sẽ tệ hơn (ví dụ: tôi có thể thấy 88% giá trị nằm trong khoảng tin cậy 95%), nhưng tôi hy vọng chỉ tệ hơn một chút.