Có một khoảng dự đoán phải chứa giá trị trung bình?


8

Tôi đang có một vấn đề lớn với một vấn đề khái niệm mà tôi đã đưa ra.

Nói rằng một công ty có một phân phối rất sai lệch. Một cái gì đó tương tự như một cấp số nhân hoặc lognatural chỉ cực đoan hơn. Bây giờ giả vờ phân phối bị sai lệch đến mức giá trị trung bình của phân phối cao hơn Tỷ lệ phần trăm 99% của phân phối. (Aka 1-2 giá trị cực cao khiến giá trị trung bình cực cao so với phần còn lại của phân phối).

Theo định nghĩa, nếu phân phối này được sử dụng để dự báo giá trị trong tương lai (còn gọi là mẫu ngẫu nhiên từ phân phối) thì có nghĩa là điều đó có nghĩa là sẽ không nằm trong khoảng Dự đoán 95% không?

Trong não tôi, khoảng thời gian dự đoán 95% là một phạm vi mà 95% tất cả các giá trị trong tương lai sẽ nằm giữa. Đối với bất kỳ phân phối nào, giá trị này phải chính xác bằng 0,25 Phần trăm ở giới hạn dưới và 0,7575 phần trăm ở giới hạn trên ... Nếu giá trị trung bình cao hơn .975 Phần trăm, thì giá trị trung bình sẽ không nằm trong '95% khoảng dự đoán '.

Tôi có nghĩ về điều này không chính xác? Có vẻ lạ khi báo cáo một dự báo như

  • Giá trị dự báo trung bình: 6.000,0000
  • Khoảng dự đoán 95%: [400,5000].

1
Bạn sẽ làm gì khi dự đoán một giá trị từ một phân phối không có ý nghĩa gì cả? Tại sao bạn nghĩ sẽ là lạ khi đưa ra một dự đoán cho một phân phối như vậy?
whuber

Actuall Whuber ... bạn sẽ làm gì khi dự đoán giá trị từ phân phối mà không có ý nghĩa ... Bạn không thể thực hiện monte carlo bởi vì nó không có nghĩa gì cả ... Bạn có thể hiển thị phân phối của chính biến đó ... Bạn có thể sử dụng trung bình? Tôi thực sự không biết câu trả lời cho câu hỏi đó và có lẽ đó là một phần của sự nhầm lẫn.
Anotherdream 17/03/2015

Tôi đoán một phần của sự nhầm lẫn là đây. Tôi được yêu cầu cung cấp một khoảng dự đoán cho một biến có hành vi RẤT tương tự như thế này. "Ước tính điểm dự đoán" là trung bình động 6 tháng. Tuy nhiên, trung bình di chuyển 6 tháng cao hơn tỷ lệ phần trăm trên ... Vì vậy, "khoảng dự đoán" của tôi không bao gồm "ước tính dự đoán" của tôi. Có vẻ như mọi người đang nói rằng giá trị trung bình là một giá trị xấu được sử dụng để bắt đầu (mà tôi có thể thấy ... Tôi đã không xây dựng thứ này haha). Tôi có làm theo đúng không? Có lẽ nên sử dụng một giá trị khác làm 'ước tính điểm dự đoán'?
Anotherdream 17/03/2015

Nhận xét đầu tiên của bạn là thú vị trong cách nó dường như giới thiệu ý nghĩa không cần thiết. Một khi bạn có một mô phỏng tốt về sự phân phối của chính biến đó, tại sao điều đó không đủ thông tin để đưa ra một dự đoán tốt? Sẽ không có khả năng một giá trị trong tương lai sẽ nằm trong cơ thể chính của phân phối đó? Tại sao có nghĩa là có liên quan trong trường hợp đó?
whuber

Whuber. Tôi hoàn toàn đồng ý với những gì bạn đang nói .... Có vẻ như ý nghĩa hoàn toàn không liên quan trong ví dụ này ... Nhưng điều đó có nghĩa là nếu bạn từng chạy một mô phỏng và sử dụng "một biến thể" (trong trường hợp này là giá trị trung bình) như một ước tính điểm và phần dư của bạn bị sai lệch khủng khiếp, bạn có thể chỉ cần thực hiện lại phân phối ban đầu bằng cách lấy ước tính điểm sai lệch và lấy mẫu ngẫu nhiên từ phần dư và cộng các kết quả lại với nhau. Tôi vừa thực hiện lại dist ban đầu từ ước tính "thiên vị" và dist còn lại ... Vậy ước tính ban đầu sử dụng là gì?
Anotherdream 18/03/2015

Câu trả lời:


7

Không, một khoảng dự đoán không cần chứa giá trị trung bình. Tôi nghĩ rằng một số nhầm lẫn của bạn có thể là trộn lẫn giữa các khoảng dự đoán và khoảng tin cậy. Mặc dù mục tiêu của khoảng dự đoán là chứa một số giá trị tương lai chắc chắn của biến ngẫu nhiên, mục tiêu của khoảng tin cậy là chứa giá trị trung bình thực của phân phối.

Như bạn đã đề cập trong các bản phân phối rất sai lệch, những ý tưởng này dường như rất mâu thuẫn với nhau. Điều quan trọng là nhận ra giá trị trong mỗi số liệu thống kê được cung cấp.

Giá trị tiên đoán của giá trị trung bình là:

1) Tích lũy: Khi nhiều mẫu đến, trung bình của chúng sẽ có xu hướng trung bình thực. Vì vậy, nếu giá trị tích lũy được quan tâm (ví dụ: nếu bạn đang đánh bạc và xử lý tiền thắng hoặc thua mà bạn quan tâm đến hiệu ứng tích lũy) thì giá trị trung bình rất hữu ích.

2) Tối thiểu hóa số dư bình phương: Trong khi số dư bình phương là một số lượng lãi suất tùy ý, đáng để biết dự đoán của bạn đang giảm thiểu.

Tuy nhiên, nếu mục tiêu của bạn là giảm thiểu lỗi tuyệt đối trong dự đoán của bạn, thì giá trị dự báo trung bình là 6.000.000 không phải là điều tôi sẽ làm.


Cảm ơn vì thời gian jlimahaverprint. Vì vậy, nếu tôi hiểu bạn chính xác là một tuyên bố đúng sau đây (tôi nghĩ rằng tôi làm, nó chỉ "cảm thấy sai" haha). Nếu tôi có một biến trong đó tôi được ước tính "điểm" (sử dụng giá trị trung bình), nhưng phần dư là cực kỳ không bình thường (ví dụ theo cấp số nhân), tôi có thể lấy 'phân phối dự báo' bằng cách lấy mẫu ngẫu nhiên từ phân phối dư 10k lần (monte carlo) và sau đó phân phối mới được tạo sẽ là khoảng thời gian dự báo? Tôi nghĩ rằng đây là cách nên làm điều này, nhưng muốn xác nhận rằng tôi đang hiểu chính xác
Anotherdream

Để làm rõ câu hỏi của tôi hơn một chút. Nếu ai đó đã dự báo trung bình di chuyển 6 tháng, nhưng có phần dư không bình thường trong ước tính này ... Có đúng không khi tạo phân phối dự báo bằng cách lấy mẫu từ phân phối dư và thêm giá trị vào ước tính điểm dự báo trung bình, sau đó tính toán khoảng dự đoán 95% từ phần trăm phân phối kết quả này? Ngoài ra, bạn có thể chỉ định những gì khác bạn có thể đi cùng với "trung bình" nếu tôi muốn giảm thiểu lỗi tuyệt đối trong một dự đoán nhất định cho dữ liệu bị sai lệch? Một lần nữa tôi thực sự đánh giá cao sự giúp đỡ của bạn!
Anotherdream

Tôi vẫn gặp khó khăn trong việc giải thích câu hỏi. Hãy để tôi rõ ràng về những gì tôi đang tìm kiếm. Tôi có một biến ngẫu nhiên X và dữ liệu {x1, x2, ... xN}. Tôi giả sử trung bình cán 6 tháng này là một cái gì đó dọc theo dòng \ sum_ {j = i} ^ {i + 180} x_i / 180. Một cái gì đó dọc theo các dòng này. Đối với những gì tôi có nghĩa là về việc giảm thiểu số dư tuyệt đối, nó chỉ đơn giản là một chức năng khách quan khác. Mặc dù giá trị trung bình giảm thiểu tổng của phần dư bình phương, nhưng điều này không nhất thiết giảm thiểu phần dư tuyệt đối, nhưng một số giá trị (không nhất thiết là duy nhất) thì có.
jlimahaverford 17/03/2015

+1, điểm rất hay về một sự nhầm lẫn có thể có về khoảng dự đoán và khoảng tin cậy. Ngẫu nhiên, nếu bạn muốn giảm thiểu lỗi tuyệt đối dự kiến, bạn sử dụng trung bình của phân phối dự báo như dự báo điểm của bạn ( xem tại đây ). Điều này tất nhiên sẽ luôn được bao gồm trong một khoảng dự đoán (trung tâm).
Stephan Kolassa 17/03/2015

Stephan. Nhận xét của bạn giúp một BUNCH. Tôi nghĩ rằng đây là những gì cần phải xảy ra trong tương lai của những ước tính này. Thực sự tôi nghĩ rằng vấn đề là sự sai lầm khi bắt đầu sử dụng các phân phối sai lệch như vậy ... Nhưng vì họ đã bắt đầu ở đây, tôi đã bối rối với những gì tôi có thể làm ... Có phải là 'chấp nhận được' khi sử dụng trung bình như một 'ước tính điểm dự báo' và đưa ra giới hạn? Tôi rất mới để dự báo và không chắc chắn nếu điều đó thường được thực hiện với các bản phân phối sai lệch ..
Anotherdream 17/03/2015

1

Hãy xem xét phân phối lợi nhuận có thể có trong nghịch lý St Petersburg:

Xác suất (1) = 1/2

Xác suất (2) = 1/4

Có lẽ (4) = 1/8 ... Có thể (2 ^ n) = 1/2 ^ (n + 1)

Các phân kỳ trung bình và nằm ngoài bất kỳ khoảng dự đoán hợp lý nào. (Trung vị là 1 trong trường hợp này, nhưng tôi không biết những gì tôi sử dụng cho dự báo quan điểm của mình. Có lẽ Stephan Kolassa, xem ở trên, có một gợi ý.)

Có một sự phức tạp khác: giả sử bạn muốn có khoảng dự đoán 95% cho một số phân phối (khác với phân phối tôi vừa đề cập). Bạn đi từ ô 2,5% đến ô 97,5% hay 0 đến 95 hoặc 5 đến 100 hay ....? Câu trả lời có lẽ phụ thuộc vào lý do tại sao bạn đặt câu hỏi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.