Hãy tưởng tượng thiết lập sau: Bạn có 2 đồng xu, đồng xu A được đảm bảo công bằng và đồng xu B có thể có hoặc không công bằng. Bạn được yêu cầu thực hiện 100 lần lật đồng xu, và mục tiêu của bạn là tối đa hóa số lượng người đứng đầu .
Thông tin trước đây của bạn về coin B là nó đã được lật 3 lần và mang lại 1 đầu. Nếu quy tắc quyết định của bạn chỉ đơn giản dựa trên việc so sánh xác suất dự kiến của người đứng đầu trong 2 đồng tiền, bạn sẽ lật đồng xu 100 lần và được thực hiện với nó. Điều này đúng ngay cả khi sử dụng các ước tính Bayes hợp lý (phương tiện sau) về xác suất, vì bạn không có lý do gì để tin rằng đồng B mang lại nhiều đầu hơn.
Tuy nhiên, điều gì sẽ xảy ra nếu đồng xu B thực sự thiên vị trong đầu? Chắc chắn "những người đứng đầu tiềm năng" mà bạn từ bỏ bằng cách lật đồng xu B một vài lần (và do đó có được thông tin về các thuộc tính thống kê của nó) sẽ có giá trị theo một cách nào đó và do đó sẽ ảnh hưởng đến quyết định của bạn. Làm thế nào "giá trị thông tin" này có thể được mô tả bằng toán học?
Câu hỏi: Làm thế nào để bạn xây dựng một quy tắc quyết định tối ưu về mặt toán học trong kịch bản này?