Dự báo mật độ có thêm giá trị vượt quá dự báo điểm khi hàm mất được đưa ra không?


7

Dự báo mật độ là phổ quát hơn dự báo điểm; họ cung cấp thông tin về toàn bộ phân phối dự đoán của một biến ngẫu nhiên thay vì trên hàm cụ thể của chúng (như giá trị trung bình dự đoán, trung vị, lượng tử, v.v.). Tính khả dụng của dự báo mật độ cho phép người dùng khác nhau chọn ra các yếu tố có liên quan - dự báo điểm - đó là mối quan tâm của họ. Một số người dùng sẽ tập trung vào giá trị trung bình dự đoán, số khác vào trung bình dự đoán, v.v., tùy thuộc vào chức năng mất mà dự báo được đánh giá (và có thể khác nhau giữa người dùng với người dùng). Đưa ra một dự báo mật độ, mọi nhu cầu của người dùng sẽ được thỏa mãn bất kể chức năng mất, bởi vì dự báo mật độ chứa tất cả thông tin xác suất về biến ngẫu nhiên.

Tuy nhiên, nếu chúng ta có một người dùng cụ thể và biết chức năng mất của anh ấy / cô ấy, thì

  • Dự báo mật độ có cung cấp bất kỳ giá trị gia tăng nào so với dự báo điểm phù hợp với hàm mất không?
  • Nếu câu trả lời là Không nói chung, các điều kiện để làm cho nó là Có là gì?

PS @hejseb rút ra sự song song thú vị giữa dự báo điểm phù hợp với chức năng mất và thống kê đầy đủ; có lẽ điều này có thể truyền cảm hứng cho một câu trả lời.


Nhờ câu trả lời của @ StephanKolassa, bao gồm cả phản mẫu cho những suy nghĩ ban đầu của tôi, tôi đã mở rộng câu hỏi (thêm phần thứ hai).
Richard Hardy

Làm thế nào bạn tạo ra dự báo mật độ?
Glen_b -Reinstate Monica

@Glen_b, tôi chưa nghĩ đến điều đó. Tôi hy vọng câu hỏi có ý nghĩa đối với dự báo điểm chung và mật độ. Nếu không, bạn có thể đề nghị cụ thể hóa?
Richard Hardy

Chà, ví dụ, nếu dự báo mật độ thu được bằng cách dựa vào hàm mất mát (nói ở đâu L=log(f) cho một số f, được chỉ định đến một hằng số chia tỷ lệ), thì điều đó sẽ khác hoàn toàn so với nếu nó được dẫn xuất theo một cách khác.
Glen_b -Reinstate Monica

1
@Glen_b, tôi sẽ suy nghĩ nhiều hơn và cố gắng giải thích rõ hơn. Cảm ơn bạn cho đầu vào của bạn cho đến nay!
Richard Hardy

Câu trả lời:


5

Tôi có thể nghĩ về các tình huống thực tế nhiều hơn một hoặc một nửa trong đó mật độ đầy đủ tốt hơn dự báo điểm, ngay cả khi chức năng mất được biết đến.

  • Tình huống nitpicky là tình huống mà chức năng mất của người dùng không chỉ phụ thuộc vào dự báo điểm, mà còn phụ thuộc vào hai mặt hoặc thậm chí toàn bộ mật độ, nghĩa là, hàm mất là một .

    Có, một hàm mất thường được xác định để phụ thuộc vào một dự báo điểm duy nhất, vì vậy tôi lỏng lẻo với danh pháp ở đây. Tuy nhiên, những tình huống như thế này xảy ra, ví dụ, trong dự báo biến động tài chính. Hoặc nơi tôi làm việc, trong dự báo bổ sung bán lẻ: chúng tôi có thể muốn đạt được mức dịch vụ 95%, vì vậy về mặt này, chúng tôi chỉ có thể quan tâm đến dự báo lượng tử (điểm) đó. Tuy nhiên, dự báo lượng tử 95% có thể là 4, trong khi chúng ta có thể bị hạn chế bổ sung kích thước gói 8. Trong tình huống như vậy, có thể có giá trị khi biết 8 phần trăm tương ứng với bao nhiêu.

  • Tình huống phù hợp hơn là một trong đó chúng ta quan tâm đến các chức năng của mật độ dự đoán. Một lần nữa, hãy xem xét dự báo bán lẻ: vì lịch giao hàng, lệnh bổ sung của chúng tôi có thể cần phải trả trong ba ngày, từ thứ Ba đến thứ Năm. Tuy nhiên, chúng tôi dự báo về độ chi tiết hàng ngày. Vì vậy, chúng tôi có thể quan tâm đến dự báo lượng tử 95% về tổng nhu cầu và đối với tích chập, chúng tôi cần mật độ đầy đủ. (Chúng tôi cũng có thể cố gắng dự báo mức độ chi tiết của nhóm trong ba ngày, nhưng điều đó trở nên có vấn đề nếu, giả sử, một chương trình khuyến mãi bắt đầu ở giữa nhóm.)

Cảm ơn bạn vì câu trả lời. Tôi đang suy nghĩ trong các điều khoản lý thuyết quyết định như sau. Một người dùng chọn một hành động để tối đa hóa tiện ích dự kiến ​​(mất mát dự kiến ​​tiêu cực). Sự lựa chọn dựa trên dự báo. Đưa ra một dự báo mật độ, người dùng có thể tính toán tiện ích dự kiến ​​của một hành động cụ thể bằng cách tích hợp tiện ích của hành động đó so với mật độ dự đoán của kết quả. Sau đó, anh ấy / cô ấy chọn hành động (trong số tất cả những người có thể) tối đa hóa tiện ích mong đợi này. Nếu chức năng tiện ích có mức tối đa duy nhất (chức năng mất có mức tối thiểu duy nhất), thì hành động tối ưu là duy nhất.
Richard Hardy

Điều quan trọng, tồn tại một điểm trong phân phối kết quả mang lại chính xác tiện ích dự kiến ​​như trên và điểm đó xác định mục tiêu của dự báo điểm "có liên quan". Do đó, người dùng sẽ nhận được chính xác tiện ích dự kiến ​​tối đa hóa (trên tất cả các hành động có thể) bất kể dự báo anh ta nhận được là dự báo mật độ hay dự báo điểm "có liên quan", với điều kiện chất lượng của hai dự báo là "tốt như nhau". Có bất kỳ ví dụ của bạn vi phạm điều này?
Richard Hardy

Có lẽ ví dụ của bạn về [một hành động dựa trên] một khoảng dự đoán là một ví dụ hợp lệ, mặc dù tôi nghi ngờ nó (dựa trên quan điểm lý thuyết quyết định ở trên) ... Tôi tự hỏi làm thế nào tôi có thể đủ điều kiện tuyên bố trong OP (thêm một số điều kiện cho nó) để làm cho câu trả lời "dự báo mật độ không có giá trị gia tăng" chính xác. Tất nhiên, điều này không phải để vô hiệu hóa câu trả lời của bạn, mà chỉ vì lợi ích của riêng tôi để hiểu rõ hơn về tình hình. Về quy tắc tính điểm, sẽ rất thú vị khi lấy một ví dụ trong đó quy tắc tính điểm có ý nghĩa trực quan như là một hàm mất cho một người dùng cụ thể. (+1)
Richard Hardy

Trên thực tế, một đối số tương tự áp dụng cho các dự báo khoảng thời gian như dự báo mật độ. Lập luận trong câu trả lời của tôi cho thấy rằng đối với hàm mất cho trước, dự báo khoảng sẽ không có giá trị gia tăng ngoài dự báo điểm có liên quan. Về chức năng mất tùy thuộc vào dự báo, điều này có thể xảy ra khi người dùng điều chỉnh hành động của mình theo dự báo, nhưng dự báo khoảng thời gian hoặc mật độ có thể được thay thế bằng dự báo điểm có liên quan và chức năng mất sẽ được hình thành trên dự báo điểm.
Richard Hardy

Ý tôi là sự mất mát chắc chắn phụ thuộc vào kết quả nhưng không nhất thiết phải dựa vào dự báo khoảng thời gian hoặc mật độ nếu sau này có thể được thay thế bằng dự báo điểm. Kết quả là một đối số cơ bản cho hàm mất mát, nhưng loại dự báo không phải là nếu người dùng được phép lựa chọn giữa các loại dự báo khác nhau (điểm so với khoảng so với mật độ). Do đó ví dụ đầu tiên của bạn không phải là một ví dụ hợp lệ. Ví dụ thứ hai của bạn dường như không hợp lệ vì như bạn nói, chúng tôi cũng có thể cố gắng dự báo mức độ chi tiết của nhóm trong ba ngày.
Richard Hardy

4

Bối cảnh (có thể bỏ qua)

Tôi sẽ suy nghĩ theo thuật ngữ quyết định như sau. Người dùng phải chọn một hành độnga giữa một loạt các khả năng A. Hành động này sẽ mang lại cho anh ấy / cô ấy một số "tiện ích" (một khái niệm thường được sử dụng trong kinh tế)u(a;s) tùy thuộc vào trạng thái tự nhiên s điều đó sẽ được thực hiện trong tương lai, nơi sS, một tập hợp tất cả các trạng thái có thể. .

maxaAESu(a;s).

Sự lựa chọn hành động dựa trên dự báo về trạng thái tự nhiên sẽ được hiện thực hóa. Đưa ra một dự báo mật độf^S(), người dùng có thể tính toán tiện ích dự kiến ​​của một hành động cụ thể bằng cách tích hợp tiện ích của hành động đó vào phân phối dự đoán của các trạng thái tự nhiên,

ES^u(a;s)=u(a;s)f^S(s)ds.
Sau đó, anh ấy / cô ấy chọn hành động (trong số tất cả những hành động có thể) tối đa hóa tiện ích mong đợi này, a^:=argmaxaAES^u(a;s). Giá trị dự kiến ​​của tiện ích tại hành động này, đối với dự báo mật độ này làu^:=u(a^).

Nếu chức năng tiện ích có mức tối đa duy nhất (chức năng mất có mức tối thiểu duy nhất), thì hành động tối ưu là duy nhất. Nếu trạng thái tự nhiên là một biến ngẫu nhiên liên tục , tồn tại một điểm trong phân bố (trạng thái tự nhiên) mang lại chính xác u^. Điểm đó xác định mục tiêu của dự báo điểm "có liên quan". Do đó, người dùng sẽ nhận được chính xác tiện ích dự kiến ​​tối đa hóa (trên tất cả các hành động có thể) bất kể dự báo anh ta nhận được là dự báo mật độ hay dự báo điểm "có liên quan" (khối lượng xác suất đơn vị trên một trạng thái tự nhiên nhất định), được cung cấp chất lượng của hai dự báo là "tốt như nhau" (cách dễ nhất để hiểu theo cách trực quan là xem xét trường hợp cả dự báo điểm và mật độ là hoàn hảo).

Phần chính (xem nền để biết thêm chi tiết)

Tôi nghĩ thật hợp lý khi cho rằng tính hữu ích của dự báo được phản ánh đầy đủ bởi sự mất mát mà nó gây ra cho một người dùng nhất định. Sau đó, mục tiêu của người dùng là chọn một dự báo để giảm thiểu tổn thất dự kiến. Do đó, được phân phối dự đoán, người dùng sẽ thực hiện một chức năng cụ thể (ví dụ: dự đoán trung bình) để giảm thiểu tổn thất dự kiến. Phần còn lại của mật độ dự đoán sẽ không có bất kỳ giá trị gia tăng nào cho người dùng.

Nếu hàm mất có mức tối thiểu duy nhất, hàm sẽ có giá trị đơn và giá trị đó sẽ là dự báo điểm phù hợp cho người dùng. Ví dụ: nếu hàm mất của người dùng là bậc hai (có mức tối thiểu duy nhất ở mức trung bình của phân phối thực), anh ấy / cô ấy sẽ chỉ quan tâm đến dự báo về giá trị trung bình. Nếu một người dùng khác đang đối mặt với sự mất mát tuyệt đối (có mức tối thiểu duy nhất ở mức trung bình của phân phối thực sự), anh ấy / cô ấy sẽ chỉ quan tâm đến dự báo về trung vị. Việc cung cấp dự báo mật độ cho một trong hai người dùng này ngoài dự báo về trung bình và trung bình, tương ứng, sẽ có giá trị gia tăng bằng không đối với họ.

Elliott và Timmermann (2016a) viết trên p. 423-424 (liên quan đến đánh giá dự báo mật độ):

Một cách để [đánh giá dự báo mật độ] sẽ là chuyển đổi dự báo mật độ thành dự báo điểm và sử dụng các phương pháp để đánh giá dự báo điểm. Cách tiếp cận đơn giản này để đánh giá dự báo mật độ có thể phù hợp vì một số lý do. <...> [D] dự báo đảm bảo có thể được chứng minh với lý do có nhiều người dùng với các chức năng mất khác nhau. Bất kỳ một trong những người dùng này có thể kiểm tra hiệu suất của dự báo mật độ có tham chiếu đến chức năng mất cụ thể được coi là phù hợp với vấn đề của họ. Thước đo liên quan của hiệu suất dự báo là tổn thất trung bình được tính từ mỗi hàm mất cụ thể của người dùng.

Ngoài ra, với một hàm mất đã biết, dự báo mật độ thậm chí có thể kém hơn dự báo điểm có liên quan, vì hai lý do sau. Đầu tiên, dự báo mật độ thường khó sản xuất hơn dự báo điểm. Thứ hai, họ có thể đánh đổi độ chính xác / độ chính xác tại một điểm cụ thể (giả sử, trung bình hoặc trung bình) để lấy độ chính xác / chính xác trên toàn bộ phân phối đang được dự đoán. Đó là, nếu người ta dự đoán toàn bộ mật độ, người ta có thể phải hy sinh một số độ chính xác / độ chính xác để dự báo giá trị trung bình để có được độ chính xác / độ chính xác cao hơn ở nơi khác. Như Elliott và Timmermann (2016b) viết,

[T] ông mối quan hệ giữa các quy tắc chấm điểm phổ biến trong tài liệu và các chức năng mất cơ bản cho người dùng cá nhân là không rõ ràng. Do đó, quy tắc chấm điểm được sử dụng cung cấp ước tính kém về tính năng của phân phối có điều kiện mà một số người dùng muốn xây dựng.

Một trích dẫn tương tự có thể được tìm thấy trong Elliott và Timmermann (2016a) , p. 277-278:

Dường như việc cung cấp mật độ dự đoán là vượt trội so với báo cáo dự báo điểm vì cả hai (a) có thể được kết hợp với hàm mất để tạo ra bất kỳ dự báo điểm nào; và (b) không phụ thuộc vào hàm mất. Trong ước tính cổ điển về mật độ dự đoán, cả hai điểm này đều không thực sự theo kịp trong thực tế. <...> [I] n cài đặt cổ điển các phân phối dự đoán ước tính phụ thuộc vào chức năng mất. Tất cả các tham số của mật độ dự đoán cần phải được ước tính và các ước tính này yêu cầu một số hàm mất, vì vậy các hàm mất được đưa trở lại vào hỗn hợp. Điều đáng chú ý ở đây là các hàm mất mát thường được sử dụng trong ước tính mật độ không khớp với các hàm được sử dụng để dự báo điểm có thể dẫn đến dự báo điểm kém hơn. <...> Hơn nữa,

Do đó, khi chức năng mất được đưa ra, có thể có ý nghĩa tập trung vào dự báo điểm cụ thể phù hợp với chức năng mất hơn là cố gắng dự báo toàn bộ phân phối. Điều này có thể dễ dàng hơn để làm và / hoặc chính xác hơn.

Một câu hỏi quan trọng đối với bản thân tôi: có thể là dự báo điểm "có liên quan" có thể được biểu thị như là một hàm của mật độ không xác định mà là khác nhau (như là một hàm, không chỉ là giá trị của nó) cho các mật độ khác nhau? Sau đó, một dự báo mật độ sẽ là cần thiết để tìm ra dự báo điểm nào mà người ta quan tâm, làm cho dự báo mật độ trở thành một bước không thể tránh khỏi trong quá trình dự báo điểm.

Người giới thiệu:

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.