Làm thế nào tôi nên gợi ra các phân phối trước từ các chuyên gia khi lắp mô hình Bayes?
Làm thế nào tôi nên gợi ra các phân phối trước từ các chuyên gia khi lắp mô hình Bayes?
Câu trả lời:
John Cook đưa ra một số khuyến nghị thú vị. Về cơ bản, nhận phần trăm / lượng tử (không phải là phương tiện hoặc tham số tỷ lệ tối nghĩa!) Từ các chuyên gia và phù hợp với chúng với phân phối thích hợp.
http://www.johndcook.com/blog/2010/01/31/parameter-from-percentiles/
Tôi hiện đang nghiên cứu phương pháp roulette thử nghiệm cho luận án thạc sĩ của tôi như là một kỹ thuật khơi gợi. Đây là một phương pháp đồ họa cho phép một chuyên gia đại diện cho phân phối xác suất chủ quan của cô ấy cho một số lượng không chắc chắn.
Các chuyên gia được cung cấp các bộ đếm (hoặc những gì người ta có thể nghĩ là chip sòng bạc) đại diện cho mật độ bằng nhau mà tổng số sẽ lên tới 1 - ví dụ 20 chip có xác suất = 0,05 mỗi chip. Sau đó, họ được hướng dẫn sắp xếp chúng trên một lưới được in sẵn, với các thùng đại diện cho các khoảng kết quả. Mỗi cột sẽ thể hiện niềm tin của họ về xác suất nhận được kết quả bin tương ứng.
Ví dụ: Một học sinh được yêu cầu dự đoán điểm trong một kỳ thi trong tương lai. Hình dưới đây cho thấy một lưới hoàn chỉnh để khơi gợi phân phối xác suất chủ quan. Trục ngang của lưới hiển thị các thùng có thể (hoặc các khoảng đánh dấu) mà học sinh được yêu cầu xem xét. Các số ở hàng trên cùng ghi lại số lượng chip trên mỗi thùng. Lưới hoàn thành (sử dụng tổng cộng 20 chip) cho thấy sinh viên tin rằng có 30% khả năng nhãn hiệu sẽ nằm trong khoảng từ 60 đến 64,9.
Một số lý do có lợi cho việc sử dụng kỹ thuật này là:
Nhiều câu hỏi về hình dạng phân phối xác suất chủ quan của chuyên gia có thể được trả lời mà không cần đặt ra một loạt câu hỏi dài cho chuyên gia - nhà thống kê có thể chỉ cần đọc mật độ trên hoặc dưới bất kỳ điểm nào, hoặc giữa hai điểm bất kỳ.
Trong quá trình khơi gợi, các chuyên gia có thể di chuyển xung quanh các con chip nếu không hài lòng với cách họ đặt chúng ban đầu - do đó họ có thể chắc chắn về kết quả cuối cùng được nộp.
Nó buộc chuyên gia phải thống nhất trong tập hợp các xác suất được cung cấp. Nếu tất cả các chip được sử dụng, xác suất phải tổng hợp thành một.
Phương pháp đồ họa dường như cung cấp kết quả chính xác hơn, đặc biệt là đối với những người tham gia có mức độ tinh vi thống kê khiêm tốn.
Thu hút linh mục là một công việc khó khăn.
Các phương pháp thống kê để thu thập phân phối xác suất và phân phối xác suất là những hướng dẫn thực tế khá tốt để khơi gợi trước. Quy trình trong cả hai bài viết được phác thảo như sau:
Tất nhiên, họ cũng xem xét cách thức khơi gợi kết quả trong thông tin có thể phù hợp hoặc định nghĩa phân phối khác (ví dụ, trong bối cảnh Bayes, phân phối Beta ), nhưng khá quan trọng, họ cũng giải quyết những cạm bẫy phổ biến trong kiến thức chuyên gia mô hình hóa (neo, phân phối hẹp và đuôi nhỏ, v.v.).
Tôi khuyên bạn nên để chuyên gia chủ đề chỉ định giá trị trung bình hoặc chế độ của trước nhưng tôi cảm thấy thoải mái khi điều chỉnh những gì họ đưa ra theo tỷ lệ . Hầu hết mọi người không giỏi trong việc định lượng phương sai.
Và tôi chắc chắn sẽ không để chuyên gia xác định họ phân phối, đặc biệt là độ dày đuôi. Ví dụ: giả sử bạn cần một phân phối đối xứng cho trước. Không ai có thể chỉ định niềm tin chủ quan của họ một cách tinh vi đến mức phân biệt phân phối bình thường với phân phối Sinh viên với 5 bậc tự do. Nhưng trong một số bối cảnh, t (5) trước mạnh hơn nhiều so với trước. Tóm lại, tôi nghĩ rằng việc lựa chọn độ dày đuôi là một vấn đề thống kê kỹ thuật, không phải là vấn đề định lượng ý kiến chuyên gia.
Câu hỏi thú vị này là chủ đề của một số nghiên cứu trong ACERA . Nhà nghiên cứu chính là Andrew Speirs-Bridge, và công việc của anh ấy nổi bật là google :)