Đánh giá chất lượng phân phối dự đoán


7

Tôi có một tập hợp các điểm dữ liệu Xi,yi Ở đâu x là các biến độc lập và tôi tin rằng mỗi yi có thể được mô hình hóa như được rút ra từ một phân phối theo cấp số nhân với các tham số λi.

Nếu tôi sử dụng Xi dự đoán λi, làm cách nào tôi có thể đánh giá chất lượng của các bản phân phối dự đoán của mình đối với các quan sát yi?

Chỉnh sửa: Đây thực chất là cùng một câu hỏi như Làm thế nào để đánh giá chất lượng của công cụ ước tính xác suất cho các thí nghiệm Bernoulli? nhưng trong một bối cảnh liên tục chứ không phải là một bối cảnh nhị thức. Nó không rõ ràng đối với tôi nên sử dụng cái gì trong trường hợp này thay vì entropy chéo.

Câu trả lời:


7

Cách tiếp cận tiêu chuẩn cho việc này là sử dụng khả năng đăng nhập của phân phối theo cấp số nhân. Đây thực sự là chính xác làm thế nào entropy chéo có nguồn gốc, đó là khả năng đăng nhập của phân phối Bernoulli.

Trong trường hợp phân phối theo cấp số nhân, pdf là:

f(y;λ)=λeλy

Vì vậy, khả năng đăng nhập là:

LL(λi;yi)=log(f(yi;λi))=log(λi)λiyi

Vì vậy nếu yi là giá trị thực sự của bạn, và λi là những dự đoán của bạn, một mô hình theo cấp số nhân sẽ giảm thiểu:

LL({λi};{yi})=ilog(λi)λiyi

Lắp mô hình bằng cách tối đa hóa khả năng đăng nhập theo cách này dẫn đến lý thuyết về mô hình tuyến tính tổng quát; mô hình hàm mũ là một trường hợp đặc biệt.


3

Cách tiêu chuẩn để đánh giá phân phối dự đoán là thông qua các quy tắc tính điểm . Khả năng đăng nhập mà Matthew Drury đề xuất là một ví dụ, đó là quy tắc tính điểm logarit . Cũng có những người khác. Merkle & Steyvers (2013, Phân tích quyết định ) thảo luận về cách các quy tắc tính điểm khác nhau kết hợp với nhau và cách chọn một quy tắc.

Thông tin thêm có thể được tìm thấy trong thẻ wiki và chúng tôi có một số câu hỏi mang nhãn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.