Tôi đang có một vấn đề lớn với một vấn đề khái niệm mà tôi đã đưa ra.
Nói rằng một công ty có một phân phối rất sai lệch. Một cái gì đó tương tự như một cấp số nhân hoặc lognatural chỉ cực đoan hơn. Bây giờ giả vờ phân phối bị sai lệch đến mức giá trị trung bình của phân phối cao hơn Tỷ lệ phần trăm 99% của phân phối. (Aka 1-2 giá trị cực cao khiến giá trị trung bình cực cao so với phần còn lại của phân phối).
Theo định nghĩa, nếu phân phối này được sử dụng để dự báo giá trị trong tương lai (còn gọi là mẫu ngẫu nhiên từ phân phối) thì có nghĩa là điều đó có nghĩa là sẽ không nằm trong khoảng Dự đoán 95% không?
Trong não tôi, khoảng thời gian dự đoán 95% là một phạm vi mà 95% tất cả các giá trị trong tương lai sẽ nằm giữa. Đối với bất kỳ phân phối nào, giá trị này phải chính xác bằng 0,25 Phần trăm ở giới hạn dưới và 0,7575 phần trăm ở giới hạn trên ... Nếu giá trị trung bình cao hơn .975 Phần trăm, thì giá trị trung bình sẽ không nằm trong '95% khoảng dự đoán '.
Tôi có nghĩ về điều này không chính xác? Có vẻ lạ khi báo cáo một dự báo như
- Giá trị dự báo trung bình: 6.000,0000
- Khoảng dự đoán 95%: [400,5000].