Làm thế nào để đo lường chính xác dự báo xác suất?


8

Giả sử tôi đưa ra một loạt các dự báo xác suất như:

  • 70% xác suất tăng trưởng doanh thu sẽ là 10 - 15% trong Q1, 10% xác suất tăng trưởng doanh thu sẽ> 15%, xác suất 20% rằng tăng trưởng doanh thu sẽ <10%

Với dữ liệu thực tế, cách tốt nhất để đo lường hoặc theo dõi độ chính xác của tôi là gì? Điểm số Brier?

Và tôi có thể tính trung bình điểm Brier của mình cho các loại dự báo khác nhau không? (ví dụ: Tìm điểm số của dự báo cho dự đoán "có 80% khả năng mưa" và tính trung bình với dự báo tăng trưởng doanh số)


1
Tôi ngần ngại sử dụng điểm Brier cho kết quả thứ tự với hơn 3 danh mục, chẳng hạn như ở đây nơi bán hàng có thể được phân loại là thấp / trung bình / cao. Điểm Brier coi mỗi kết quả là tương đương với các kết quả khác.
RobertF

1
Là dữ liệu của bạn vốn đã là thứ tự, như @RobertF dường như giả định? Nếu vậy, điều này làm tăng thêm sự phức tạp, như ông viết, và sẽ tốt hơn nếu bạn có thể chỉnh sửa điều này vào bài viết của mình. Nếu không, bạn có thể sử dụng các quy tắc tính điểm thích hợp , như Brier hoặc các quy tắc khác. Và vâng, bạn có thể trung bình chúng.
Stephan Kolassa

Tôi tin rằng ví dụ của tôi sử dụng dữ liệu thứ tự, nhưng tôi không hiểu ý của bạn là "vốn có thứ tự". Tuy nhiên, tôi có thể thay đổi dự báo của mình để chỉ tăng trưởng doanh số 12%. Nếu vậy tôi sẽ sử dụng một cái gì đó như MAE? Nhưng lý do tôi đưa vào các xác suất là để tính đến sự thay đổi và các sự kiện hiếm. Ví dụ, tăng trưởng doanh số dự kiến ​​của dự báo của tôi có thể là 12%, nhưng có thể có một xác suất nhỏ về tăng trưởng doanh thu âm. Mặc dù không có khả năng xảy ra nhưng có thể có giá trị để biết khả năng tăng trưởng doanh số âm. Vì vậy, tôi muốn phản ánh điều đó trong dự báo của tôi bằng cách nào đó.
Emile

Theo "vốn dĩ", ý tôi là liệu vấn đề tiềm ẩn của bạn là thứ tự hay liệu ví dụ bạn sử dụng có phải là thứ tự hay không. Rõ ràng, đó là trước đây.
Stephan Kolassa

Câu trả lời:


6

Nhận xét của bạn nghe có vẻ như bạn đang thực sự tìm kiếm một dự báo mật độ hơn là dự báo điểm, tức là bạn muốn dự báo phân phối xác suất đầy đủ của (các) kết quả trong tương lai. Đây là một ý tưởng rất tốt. Dự báo mật độ là phổ biến trong dự báo tài chính hoặc kinh tế lượng, nhưng thật không may, nó hiếm khi được xử lý trong các sách giáo khoa và khóa học dự báo khác. Tay & Wallis (2000, Tạp chí Dự báo ) đưa ra một khảo sát sớm hữu ích.

Cách phổ biến nhất để đánh giá dự báo mật độ sử dụng Biến đổi tích phân xác suất (PIT). Tài liệu tham khảo kinh điển là Diebold, Gunther & Tay (1998, Tạp chí kinh tế quốc tế ) . Berkowitz (2001, Tạp chí Thống kê Kinh doanh & Kinh tế )Bao, Lee & Saltoglu (2007, Tạp chí Dự báo ) đưa ra giải pháp thay thế.

Gần đây, sự quan tâm đã tăng lên trong các quy tắc tính điểm (thích hợp) , như điểm Brier mà bạn đề cập. Văn học bao gồm Mitchell & Wallis (2011, Tạp chí Kinh tế lượng ứng dụng )Gneiting, Balabdaoui & Raftery (2007, JRSS-B ) .

Cuối cùng, Gneiting & Katzfuss (2014, Đánh giá thống kê hàng năm và ứng dụng của nó ) đưa ra một cái nhìn tổng quan gần đây hơn về dự báo mật độ (hoặc xác suất), tập trung lại vào các quy tắc tính điểm.


Bạn có thể giải thích, theo thuật ngữ giáo dân, phương pháp thích hợp nhất để đưa ra dự báo mật độ và quy tắc tính điểm phù hợp nhất cho ví dụ của tôi. Hoặc bạn có thể chỉ vào một bài viết / cuốn sách. Tôi đoán những gì tôi đang hỏi là một công thức: các bước để đưa ra dự báo mật độ / xác suất, sau đó là một số bước khác để đánh giá độ chính xác của từng dự báo và / hoặc nhiều dự báo. Và lý tưởng nhất là tôi có thể thực hiện phép tính trên một máy tính thông thường (không cần phần mềm chuyên dụng). Nếu một số tích phân là bắt buộc, tôi có thể thực hiện loại xấp xỉ nào để đơn giản hóa phương trình. Tìm kiếm một cái gì đó tôi có thể làm "mặt sau của phong bì".
Emile

Tôi rất thích đọc những bài báo đó, nhưng thật lòng mà nói chúng ở trên đầu tôi.
Emile

Ah. Tôi khuyên bạn nên xem xét một cuốn sách giáo khoa dự báo tiêu chuẩn, ví dụ: Ord & Fildes, Nguyên tắc Dự báo Kinh doanh , phần 5.2 và các phần khác, trong đó các khoảng dự đoán được tính bằng cách sử dụng phương pháp phân phối bình thường. Hyndman & Athanosopoulos không may không bao gồm dự báo mật độ. Theo quy tắc tính điểm, tôi thực sự không nghĩ rằng có một quy tắc "tốt nhất" rõ ràng trong trường hợp của bạn - chỉ cần chọn một quy tắc mà bạn có thể thực hiện dễ dàng. Tuy nhiên, ít nhất bạn sẽ cần các bảng phân phối bình thường, vì vậy sẽ rất tốt nếu bạn nhìn vào R ....
Stephan Kolassa

... Hyndman & Athanasopoulos làm mọi thứ với R, vì vậy cuốn sách của họ đóng vai trò là một giới thiệu hay về dự báo bằng R. Chúc may mắn!
Stephan Kolassa
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.