Bạn quan sát k đầu ra khỏi n quăng. Là đồng tiền công bằng?


13

Tôi đã được hỏi câu hỏi này với (n,k)=(400,220) trong một cuộc phỏng vấn. Có câu trả lời "đúng" không?

Giả sử các quăng là iid và xác suất của các đầu là p=0.5 . Sự phân bố số lượng đầu trong 400 lần ném nên gần với Bình thường (200, 10 ^ 2), sao cho 220 đầu là 2 độ lệch chuẩn so với giá trị trung bình. Xác suất quan sát kết quả như vậy (nghĩa là có nhiều hơn 2 SD so với giá trị trung bình theo một trong hai hướng) là ít hơn 5%.

Người phỏng vấn nói với tôi, về cơ bản, "nếu tôi quan sát thứ gì đó> = 2 SD từ giá trị trung bình, tôi kết luận rằng có một cái gì đó khác đang diễn ra. Tôi sẽ đặt cược chống lại đồng xu là công bằng." Điều đó hợp lý - xét cho cùng, đó là điều mà hầu hết các bài kiểm tra giả thuyết làm. Nhưng đó có phải là kết thúc của câu chuyện? Đối với người phỏng vấn dường như là câu trả lời "đúng". Điều tôi đang hỏi ở đây là liệu một số sắc thái có hợp lý không.

Tôi không thể không chỉ ra rằng việc quyết định rằng đồng tiền không công bằng là một kết luận kỳ lạ trong bối cảnh tung đồng xu này. Tôi có đúng không khi nói điều đó? Tôi sẽ thử và giải thích bên dưới.

Trước hết, tôi - và tôi cũng sẽ cho rằng hầu hết mọi người - có một ưu tiên mạnh mẽ về tiền xu: họ rất có thể công bằng. Tất nhiên, điều đó phụ thuộc vào ý nghĩa của chúng ta về sự công bằng - một khả năng sẽ là định nghĩa "công bằng" là "có xác suất đứng đầu" gần 0,5, trong khoảng từ 0,49 đến 0,51 ".

(Bạn cũng có thể định nghĩa 'công bằng' có nghĩa là xác suất của những người đứng đầu chính xác là 0,5, trong trường hợp đó có một đồng tiền hoàn toàn công bằng bây giờ dường như không có khả năng.)

Sự ưu tiên của bạn có thể không chỉ phụ thuộc vào niềm tin chung của bạn về tiền mà còn phụ thuộc vào bối cảnh. Nếu bạn rút đồng xu ra khỏi túi của mình, bạn có thể gần như chắc chắn rằng nó công bằng; nếu người bạn ảo thuật gia của bạn rút nó ra khỏi anh ta, thì trước đó bạn có thể đặt nặng hơn vào những đồng xu hai đầu.

Trong mọi trường hợp, thật dễ dàng để đưa ra các linh mục hợp lý rằng (i) đặt một xác suất lớn cho đồng tiền là công bằng và (ii) dẫn đến hậu thế của bạn khá giống nhau, ngay cả sau khi quan sát 220 đầu. Sau đó, bạn sẽ kết luận rằng đồng xu rất có thể là công bằng, mặc dù quan sát kết quả 2 SD từ giá trị trung bình.

Trong thực tế, bạn cũng có thể xây dựng ví dụ nơi quan sát 220 người đứng đầu trong 400 tung làm sau bạn đặt nhiều trọng lượng trên đồng xu phúc công bằng, ví dụ nếu tất cả tiền xu không công bằng có một xác suất của người đứng đầu trong .{0,1}

Ai đó có thể làm sáng tỏ vấn đề này giúp tôi không?


Sau khi viết câu hỏi này, tôi nhớ rằng tôi đã nghe về tình huống chung này trước đây - không phải đó là "nghịch lý" của Lindley sao?

Whuber đặt một liên kết rất thú vị trong các bình luận: Bạn có thể tải một cái chết, nhưng bạn không thể thiên vị một đồng xu . Từ trang 3:

Sẽ không có nghĩa gì khi nói rằng đồng xu có xác suất p đầu, bởi vì nó có thể được xác định hoàn toàn bằng cách ném nó trừ khi nó được tung lên cao trong không khí với một vòng quay nhanh và bị cuốn vào không trung không nảy, trong trường hợp p = 1/2.

Tuyệt đấy! Điều này liên quan đến câu hỏi của tôi theo một cách thú vị: giả sử chúng ta biết rằng đồng xu đang "tung lên cao trong không trung với một vòng quay nhanh và bị cuốn vào không trung mà không bị nảy". Sau đó, chúng tôi chắc chắn không nên bác bỏ giả thuyết rằng đồng tiền là công bằng (trong đó "công bằng" bây giờ có nghĩa là "có p = 1/2 khi được ném theo cách được mô tả ở trên"), bởi vì chúng tôi thực sự có trước xác suất đặt tất cả vào xác suất đồng xu là công bằng. Có lẽ điều đó biện minh ở một mức độ nào đó tại sao tôi không thoải mái từ chối null sau khi quan sát 220 đầu.


1
Bất kỳ phần nào trong câu hỏi của bạn sẽ thay đổi nếu bạn diễn giải "đồng xu" như một phép ẩn dụ cho một quá trình nhị phân mà bạn không có kiến ​​thức trước?
whuber

1
@whuber Đó là một câu hỏi hay. Tôi nghĩ trong trường hợp đó tôi sẽ sẵn sàng hơn với "từ chối khi p <= 0,05", mặc dù tôi không chắc chắn làm thế nào để biện minh cho điều đó với chính mình.
Adrian

Một vấn đề khác làm phiền tôi là người đặt câu hỏi quan tâm đến giả thuyết rằng p = 0,5 chính xác. Nhưng nếu bạn nghĩ rằng p được phân phối liên tục, điều đó sẽ có xác suất bằng 0, bất kể bạn quan sát điều gì. Nó gây ấn tượng với tôi nhiều hơn khi đưa ra những tuyên bố về p thuộc về một khoảng nào đó. Đây sẽ là một vấn đề trong tình huống mà tôi không có kiến ​​thức trước và quyết định sử dụng đồng phục trước đó, ví dụ.
Adrian

3
Nó có ý nghĩa. Tuy nhiên, câu hỏi tập trung vào đồng xu là một chút mất tập trung, bởi vì câu trả lời cho những câu hỏi như vậy thường đi sâu vào các cuộc thảo luận về vật lý (và bóng bẩy) của việc lật đồng xu. Bạn có thể bị sốc khi thấy tình huống thực tế có thể xảy ra với các linh mục mạnh mẽ của bạn như thế nào , tùy thuộc vào cách lật đồng xu. "Không có nghĩa gì khi nói rằng đồng xu có xác suất đứng đầu"p .
whuber

1
@Adrian DJC MacKay thảo luận về vấn đề chính xác này (với n = 250, k = 140) trong sách giáo khoa miễn phí của mình tại liên kết này: inference.phy.cam.ac.uk/itprnn/book.pdf (p63.) đọc những gì anh ấy nói Anh ta đi đến một kết luận tương tự với bạn.
Flounderer

Câu trả lời:


4

Cách Bayes tiêu chuẩn để giải quyết vấn đề này (không có xấp xỉ Bình thường) là nói rõ ràng trước, kết hợp nó với khả năng của bạn, được phân phối Beta. Sau đó, tích hợp hậu thế của bạn khoảng 50%, nói hai độ lệch chuẩn hoặc từ 49% C 5151% hoặc bất cứ điều gì bạn thích.

Nếu niềm tin trước của bạn liên tục vào [0,1] - ví dụ Beta (100.100) (điều này đặt rất nhiều khối lượng vào các đồng tiền gần như công bằng) - thì khả năng đồng tiền đó là bằng 0 vì khả năng cũng liên tục [0 , 1].

Ngay cả khi xác suất mà đồng tiền là bằng 0, bạn thường có thể trả lời bất kỳ câu hỏi nào bạn sẽ trả lời với người đăng sau về sự thiên vị. Ví dụ, cạnh sòng bạc được phân phối sau là bao nhiêu so với xác suất tiền xu.


1
+1, nhưng tôi muốn bổ sung câu trả lời này một chút. Giả sử rằng chúng tôi xác định một đồng tiền công bằng là như OP gợi ý và chúng tôi muốn đặt 99 % xác suất trước đó của chúng tôi trong trường hợp này. Sau đó, một hợp lý trước là p ~ Beta ( 8300 , 8300 ) , do đó P ( p ( 0,49 , 0,51 ) ) = 0,99003. Cho dữ liệu trong câu hỏi, phân phối sau trở thành p | dữ liệu Beta (0.49<p<0.5199%pBeta(8300,8300)
P(p(0.49,0.51))=0.99003.
và xác suất sau của một đồng tiền công bằng vẫn rất lớn: P ( p ( 0,49 , 0,51 ) | dữ liệu ) = 0,9886. p|dataBeta(8300+220,8300+180)
P(p(0.49,0.51)|data)=0.9886.
knrumsey

2

Hãy nói về Phân phối Bernoulli, trong trường hợp này là việc tung đồng xu.

Rõ ràng đây là phân phối nhị thức B(n=400,p=0.5)N(μ=200,σ2=100)

k95%B(n=400,p=0.5)pB(n=400,p=0.5,k=220)

p=0.5π(p=0.5)=0.5π(p0.5)=0.5

π(0.49p0.51)=0.9π(p<0.49p>0.51)=0.1p

P(0.49p0.51|k=220)

pN(μ=0.5,σ2=0.25)σ2=0.1

pf(p|k=220)


Danh tiếng của tôi không đủ để tôi viết bình luận dưới Câu hỏi. Thay vào đó tôi sẽ viết một cái gì đó ở đây liên quan đến Bạn không thể thiên vị một đồng xu . @Adrian

Đây là những gì chúng ta có

  1. Kết quả thí nghiệm B(n=400,k=220,p=θ)
  2. Nghiên cứu lý thuyết và thử nghiệm Bạn không thể thiên vị một đồng xu

Đây là giả thuyết của chúng tôi

H0:θ^=0.5

H1

Đây là kết quả của chúng tôi

  1. H0
  2. H1

pH0H1

Nếu không, chúng tôi tạo ra tiêu chuẩn kép để kiểm tra giả thuyết ở đây. Chúng tôi không thể chấp nhận Giả thuyết rằng việc tung đồng xu là công bằngdữ liệu thử nghiệm được ghi lại chính xác .


Không có nghĩa gì khi nói rằng đồng xu có xác suất p đứng đầu

Chúng tôi có kết quả thí nghiệm để sao lưu giả thuyết này.

pN(μ=0.5,σ2)

σs


1
Cảm ơn bạn Trương. Một nit nhỏ: nếu bạn muốn sử dụng phân phối Bình thường cho xác suất trước của mình, tôi muốn nói rằng bạn nên cắt bớt nó để p nằm trong [0, 1].
Adrian

Tất nhiên có nhiều phân phối hợp lý trước và hậu thế tương ứng. Điểm thực sự của câu hỏi của tôi là khái quát hơn: quyết định rằng đồng xu không công bằng đối với tôi dường như là một kết luận kỳ quái trong bối cảnh tung đồng xu này. Bạn nghĩ gì về điều đó - và tại sao?
Adrian

Một thuận tiện trước đây sẽ là phân phối Beta, vì nó liên hợp với khả năng của Binomial. Nhưng một lần nữa, lực đẩy thực sự của câu hỏi của tôi là chung chung hơn so với cụ thể trước đó.
Adrian

π(p=0.5)pU(0,1)E(p)f(p|k=220)p=0.5E(p). Và chúng ta dễ dàng chấp nhận giả thuyết rằng đồng tiền không công bằng. Đặc biệt trong trường hợp này, bạn sẽ không thấy việc quyết định đồng tiền là không công bằng để trở thành một kết luận kỳ quái.
Zhang Tschao

@ user777 Phân phối bình thường xuất hiện hai lần trong phản hồi của Zhang, lần đầu tiên là xấp xỉ với nhị thức (tuyệt vời) và lần thứ hai là xác suất trước của các đầu (khi ông nói "ưu tiên là phân phối bình thường p ~ N"). Zhang - bản chỉnh sửa của bạn về Null là "đồng tiền là công bằng và dữ liệu được ghi lại chính xác" rất thú vị, cảm ơn bạn đã đăng nó.
Adrian
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.