Để tối đa hóa cơ hội đoán chính xác kết quả của việc lật đồng xu, tôi có nên luôn luôn chọn kết quả có thể xảy ra nhất không?


20

Đây không phải là bài tập về nhà. Tôi quan tâm đến việc hiểu nếu logic của tôi là đúng với vấn đề thống kê đơn giản này.

Giả sử tôi có một đồng xu 2 mặt trong đó xác suất lật đầu là P(H) và xác suất lật đuôi là . Giả sử tất cả các lần lật có xác suất độc lập. Bây giờ, giả sử tôi muốn tối đa hóa cơ hội dự đoán liệu đồng xu sẽ là đầu hay đuôi trong lần lật tiếp theo. Nếu , tôi có thể đoán đầu hoặc đuôi một cách ngẫu nhiên và xác suất tôi đúng là .P ( H ) = 0,51P(H)P(H)=0.50.5

Bây giờ, giả sử rằng , nếu tôi muốn tối đa hóa cơ hội đoán chính xác của mình, tôi có nên luôn đoán đuôi có xác suất là không?0,8P(H)=0.20.8

Tiến lên một bước nữa, nếu tôi có một cái chết 3 mặt và xác suất lăn 1, 2 hoặc 3 là , và , tôi có nên luôn đoán 2 để tối đa hóa cơ hội đoán đúng không? Có cách tiếp cận nào khác cho phép tôi đoán chính xác hơn không?P ( 2 ) = 0,5 P ( 3 ) = 0,4P(1)=0.1P(2)=0.5P(3)=0.4


4
Nghe có vẻ như tôi đang hỏi về sự độc lập: ví dụ nếu bạn đứng đầu một lần, điều đó có làm cho 'đuôi' có khả năng cao hơn vào lần tới không? Nếu đây không phải là những gì bạn đang hỏi, bạn có thể làm rõ câu hỏi của bạn? (Nếu tôi đã hiểu chính xác câu hỏi của bạn, câu trả lời là 'có': trong các tình huống như tung đồng xu, kết quả rất có thể sẽ luôn là kết quả có xác suất cao nhất, bất kể điều gì đã xảy ra trước đó.)
arbovirus

Cảm ơn sự giúp đỡ @arbovirus. Vâng, tôi đang giả định độc lập. Tôi đã cập nhật câu hỏi để chỉ ra điều này.
rùa

4
Giả sử sự độc lập, điều tốt nhất bạn có thể làm là chọn bên có xác suất cao nhất. Nghĩ theo cách này. Bạn không có thông tin nào khác để đoán đúng hơn. Tất cả những gì bạn biết về súc sắc là tần suất một mặt nào đó xuất hiện và những gì cặp đôi cuối cùng ném là. Nhưng sự độc lập cho bạn biết rằng các hàng trước không có tác dụng đối với cú ném hiện tại. Có thể nếu bạn có nhiều thông tin hơn như lượng lực dùng để ném xúc xắc, tay ném trái / tay phải hoặc số lần lắc trước khi lăn. Tuy nhiên, nếu xúc xắc thực sự công bằng, tôi nghi ngờ thậm chí mức độ chi tiết đó sẽ cung cấp dự đoán tốt hơn.
Brent Ferrier

Dự đoán của bạn là chính xác; nó là một hệ quả trực tiếp của sự bất bình đẳng Chủ (với các thông số ). (1,)
whuber

Bạn có biết rằng P (H) = 0,2? Hay đó là một cái gì đó mà bạn phải tìm ra bằng cách quan sát kết quả?
Akavall

Câu trả lời:


43

Bạn đúng. Nếu và bạn đang sử dụng mất không một (nghĩa là, bạn cần đoán kết quả thực tế trái ngược với xác suất hoặc điều gì đó, và hơn nữa, nhận được đầu khi bạn đoán đuôi cũng tệ như nhận được đuôi khi bạn đoán đầu), bạn nên đoán đuôi mỗi lần.P(H)=0.2

Mọi người thường lầm tưởng rằng câu trả lời là đoán đuôi trên 80% thử nghiệm được chọn ngẫu nhiên và đứng đầu trong phần còn lại. Chiến lược này được gọi là " kết hợp xác suất " và đã được nghiên cứu rộng rãi trong việc ra quyết định hành vi. Xem, ví dụ,

Tây, RF, & Stanovich, KE (2003). Là xác suất phù hợp thông minh? Liên kết giữa lựa chọn xác suất và khả năng nhận thức. Bộ nhớ & nhận thức, 31 , 243ơi251. doi: 10.3758 / BF03194383


1
+1 cho con trỏ khớp xác suất. Chưa bao giờ nghe về điều đó trước đây, mặc dù tôi chắc chắn rằng tôi tận dụng nó hàng ngày như một thiên kiến ​​nhận thức! :)
leekaiinthesky

2
(+1) Điều này liên quan đến một quan niệm sai lầm phổ biến trong việc diễn giải các mô hình hồi quy đa biến và tương tự: mọi người có thể ngạc nhiên rằng việc phân phối các lớp dự đoán không khớp với phân phối của các lớp được quan sát, và thậm chí chọc vào các cách để "sửa" nó . (Rất vui được biết nó có một cái tên.)
Scortchi - Tái lập Monica

1
(+1) cho cụm từ "khớp xác suất".
Haitao Du

13

Về cơ bản, bạn đang hỏi một câu hỏi rất thú vị: tôi nên dự đoán bằng cách sử dụng "MAP Bayesian" Tối đa một ước tính posteriori hoặc "Real Bayesian".

Giả sử bạn biết phân phối thực sự rằng , sau đó sử dụng ước tính MAP, giả sử bạn muốn đưa ra 100 dự đoán về 100 kết quả lật tiếp theo. Bạn nên luôn luôn đoán lật là đuôi , KHÔNG đoán 20 đầu và 80 đuôi. Đây được gọi là "MAP Bayesian", về cơ bản bạn đang làmP(H)=0.22080

argmaxθf(x|θ)

Không khó để chứng minh rằng bằng cách làm như vậy, bạn có thể giảm thiểu lỗi dự đoán (mất 0-1). Bằng chứng có thể được tìm thấy trong ~ trang 53 của Giới thiệu về Học thống kê .


Có một cách khác để làm điều này được gọi là phương pháp "Real Bayesian". Về cơ bản, bạn không cố gắng "chọn kết quả với xác suất cao nhất, nhưng hãy xem xét tất cả các trường hợp theo cách thực tế" Vì vậy, nếu ai đó yêu cầu bạn "dự đoán 100 lần lật" tiếp theo, bạn nên tạm dừng anh ấy / cô ấy, bởi vì khi bạn đưa ra 100 kết quả nhị phân, thông tin xác suất cho mỗi kết quả biến mất. Thay vào đó, bạn nên hỏi, những gì bạn muốn làm SAU khi biết kết quả.

Giả sử anh ấy / cô ấy có một số Chức năng mất (không cần thiết để mất 0-1, ví dụ, chức năng mất có thể, nếu bạn bỏ lỡ một cái đầu, bạn cần phải trả $ 1, nhưng nếu bạn bỏ lỡ một cái đuôi, bạn cần phải trả $ 5, tức là mất cân bằng) theo dự đoán của bạn, sau đó bạn nên sử dụng kiến ​​thức của mình về phân phối kết quả để giảm thiểu tổn thất trên toàn bộ phân phối

xyp(x,y)L(f(x),y)

, nghĩa là kết hợp kiến ​​thức của bạn về phân phối vào mất mát, thay vì "cách thức theo giai đoạn", nhận dự đoán và thực hiện các bước tiếp theo.

Hơn nữa, bạn có một trực giác rất tốt về những gì sẽ có khi có nhiều kết quả có thể xảy ra. Ước tính MAP sẽ không hoạt động tốt nếu số lượng kết quả lớn và khối lượng xác suất được lan truyền rộng rãi. Hãy nghĩ về bạn có một con xúc xắc 100 mặt, và bạn biết phân phối thực sự. Trong đó P ( S 2 ) = P ( S 3 ) = P ( S 100 ) = 0,9 / 99 = 0,009090P(S1)=0.1P(S2)=P(S3)=P(S100)=0.9/99=0.009090S190%


4
MAP cũng là Bayes. Hơn nữa, bạn mô tả cả hai cách tiếp cận mà không đề cập dù sao đi nữa việc sử dụng priors những gì có thể gây hiểu lầm kể từ khi bạn đang viết về phương pháp Bayesian và priors là các tính năng cốt lõi của các phương pháp đó.
Tim

'Vì vậy, nếu ai đó yêu cầu bạn "dự đoán 100 lần lật" tiếp theo, bạn nên từ chối làm điều đó' Nếu ai đó đề nghị tôi một tỷ euro nếu tôi dự đoán chính xác, có lẽ tôi sẽ không từ chối. Hoặc có lẽ bạn có nghĩa là 'dự đoán' theo nghĩa khác với 'cố gắng đoán'.
JiK

"khi bạn đưa ra 100 kết quả nhị phân, thông tin xác suất cho mỗi kết quả sẽ biến mất" Lúc đầu tôi đọc nó là "khi bạn được đưa ra 100 kết quả nhị phân" và không thể hiểu câu, nhưng bây giờ tôi nhận ra nó có nghĩa là "khi bạn đưa ra 100 kết quả nhị phân ". Cái nào đúng và nếu là cái đầu tiên, nó có nghĩa là gì?
JiK

1
Một điểm rất nhỏ: Có lẽ tôi sẽ thêm một dòng dọc sau đoạn thứ hai để chỉ ra rằng hai đoạn đầu đủ về mặt kỹ thuật để trả lời câu hỏi theo nghĩa đen và phần còn lại là thông tin bổ sung (chắc chắn là thú vị và hữu ích).
JiK

2
Ở đoạn cuối: "Ước tính MAP sẽ không hoạt động tốt nếu số lượng kết quả lớn. - - Tuy nhiên, bạn sẽ nhận được 90% số lần !!" Không làm việc tốt luôn luôn là một câu hỏi của bối cảnh. Nếu đây là một trò chơi cá cược lặp đi lặp lại (tiền cược được chia cho những người đoán đúng hoặc trả lại nếu không ai đoán), chiến lược MAP chắc chắn sẽ giành được nhiều tiền trong thời gian dài nếu bạn chơi với những người ví dụ như họ đoán từ việc phân phối kết quả.
JiK

4

Do tính độc lập, giá trị kỳ vọng của bạn luôn được tối đa hóa nếu bạn đoán trường hợp có khả năng nhất. Không có chiến lược nào tốt hơn vì mỗi lần lật / cuộn không cung cấp cho bạn bất kỳ thông tin bổ sung nào về đồng xu / chết.

Bất cứ nơi nào bạn đoán kết quả ít có khả năng bạn mong đợi chiến thắng sẽ ít hơn nếu bạn đoán được trường hợp có khả năng nhất, do đó, tốt hơn hết là bạn chỉ nên đoán trường hợp có khả năng nhất.

Nếu bạn muốn thực hiện nó để bạn cần thay đổi chiến lược của mình khi bạn lật, bạn có thể xem xét một đồng xu / chết khi bạn không biết tỷ lệ cược ban đầu và bạn phải tìm ra chúng khi bạn tung ra.


1
với tôi câu trả lời này là lời giải thích đơn giản nhất; nếu bạn phải xác định một chiến lược xem xét kết quả mà bạn có trước đó, thì điều này sẽ phá vỡ xác suất "độc lập".
Walfrat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.