Đặt cược của Blackwell


12

Tôi đã đọc về nghịch lý đặt cược của Blackwell trên tủ Futility . Dưới đây là tóm tắt: bạn được trình bày với hai phong bì, ExEy . Phong bì chứa một lượng tiền ngẫu nhiên, nhưng bạn không biết gì về việc phân phối tiền. Bạn mở một cái, kiểm tra xem có bao nhiêu tiền trong đó ( x ) và phải chọn: lấy phong bì Ex hoặc Ey ?

Futility Closet đề cập đến một nhà toán học tên là Leonard Wapner: Thật bất ngờ, có một việc bạn có thể làm, ngoài việc mở phong bì khác, để cho bản thân tốt hơn thậm chí là có cơ hội làm cho đúng.

Ý tưởng, có vẻ sai đối với tôi, như sau: chọn một số ngẫu nhiên d . Nếu d<x , lấy . Nếu , chọn .Exd>xEy

Wapner: Triệu Nếu d rơi giữa x và y thì dự đoán của bạn (như được chỉ ra bởi d) được đảm bảo là chính xác. Giả sử điều này xảy ra với xác suất p. Nếu d giảm ít hơn cả x và y, thì dự đoán của bạn sẽ chỉ đúng trong trường hợp số x bạn chọn là lớn hơn cả hai. Có 50% cơ hội này. Tương tự, nếu d lớn hơn cả hai số, dự đoán của bạn sẽ chỉ đúng nếu số bạn chọn là số nhỏ hơn trong hai số. Điều này cũng xảy ra với xác suất 50%.

Nếu xác suất mà nằm trong lớn hơn 0, thì thành công trung bình của phương pháp này là . Điều này có nghĩa là bằng cách quan sát một biến ngẫu nhiên không liên quan cung cấp cho chúng tôi thông tin bổ sung.d[x,y]12+p2

Tôi nghĩ rằng điều này hoàn toàn sai, và vấn đề nằm ở việc chọn một số ngẫu nhiên. Nó có nghĩa là gì? Giống như, số nguyên nào? Trong trường hợp đó, xác suất mà nằm giữa và là số không, vì cả hai và là hữu hạn.pdxyxy

Nếu chúng ta nói rằng có giới hạn về số tiền tối đa, giả sử hoặc ít nhất là chúng ta chọn d từ , thì công thức sẽ rút ra lời khuyên tầm thường là chọn nếu và chọn nếu .M1...MEyx<M/2Exx>M/2

Tôi có bỏ lỡ điều gì ở đây không?

BIÊN TẬP

OK, bây giờ tôi bắt đầu thấy nghịch lý rõ ràng đến từ đâu. Đối với tôi, dường như không thể có một biến ngẫu nhiên không liên quan có thể cung cấp thêm thông tin.

Tuy nhiên, lưu ý rằng chúng ta cần có ý thức chọn phân phối d . Ví dụ: chọn ranh giới cho phân phối đồng đều hoặc của phân phối Poissionian, v.v ... Rõ ràng, nếu chúng tôi đang chơi cho đậu phộng và chúng tôi đã chọn phân phối d để thống nhất trên đô la, . Xác suất cuối cùng này sẽ phụ thuộc đầu tiên và quan trọng nhất vào phán đoán của chúng tôi về những gì có thể có trong phong bì.λ[109,2109]P(d(x,y))=0

Nói cách khác, nếu kỹ thuật này hoạt động, thì giả định rằng chúng ta không biết phân phối tiền trong phong bì là gì (cách chọn số tiền cho phong bì) đã bị vi phạm. Tuy nhiên, nếu chúng ta thực sự không biết những gì trong phong bì, thì trong trường hợp xấu nhất, chúng ta sẽ không mất gì khi áp dụng nó.

CHỈNH SỬA 2

Một suy nghĩ khác. Cho , chúng ta chọn, để vẽ , phân phối không âm liên tục sao cho . Chúng tôi được phép làm điều đó, tôi có đúng không? Chúng tôi tiến hành theo hướng dẫn - nếu , chúng tôi giữ phong bì, nếu , chúng tôi thay đổi phong bì. Lý do không thay đổi, tùy thuộc vào cách chúng tôi chọn phân phối, có thể là (hoặc tôi có nhầm không?).d P ( d < x ) = P ( d > x ) d < x d > x P ( d [ x , y ] ) > 0xdP(d<x)=P(d>x)d<xd>xP(d[x,y])>0

Tuy nhiên, với cách chúng tôi chọn phân phối, những gì chúng tôi làm bây giờ tương đương với việc tung đồng xu. Chúng tôi ném một đồng xu, và nếu đó là đầu, chúng tôi thay đổi phong bì, nếu đó là đuôi, chúng tôi dính vào phong bì chúng tôi giữ. Tôi sai ở đâu

EDIT 3 :

OK, tôi hiểu rồi Nếu chúng ta căn cứ chức năng xác suất trên x (ví dụ, chúng tôi mẫu d từ một phân bố đồng đều trong phạm vi ( 1 , 2 x ) , sau đó xác xuất P ( d ( x , y ) ) không phải là độc lập với P ( quyết định đúng đắn | d ( x , y ) ) .dxd(1,2x)P(d(x,y))P(correct decision|d(x,y))

Vì vậy, nếu (với xác suất p ), đoán phải lúc nào cũng đúng, như trước đây. Nếu x là số thấp hơn, tuy nhiên, và d ( x , y ) , hơn d có cơ hội cao hơn để được thấp hơn x hơn là cao hơn so với x , vì vậy chúng tôi thiên về một quyết định không chính xác. Lý luận tương tự áp dụng khi x là số cao hơn của hai số.d(x,y)pxd(x,y)dxxx

Điều đó có nghĩa là chúng ta phải chọn quá trình vẽ độc lập với x . Nói cách khác, chúng ta cần đoán về các tham số phân phối mà từ đó xy được rút ra; điều tồi tệ nhất xảy ra là chúng ta vẫn đoán ngẫu nhiên, nhưng điều tốt nhất xảy ra là dự đoán của chúng ta đã đúng - và sau đó chúng ta có lợi thế. Làm thế nào điều này sẽ tốt hơn so với việc đoán "x và y sẽ, tôi nghĩ, ít nhất là 1 đô la , nhưng nhiều nhất là 10 đô la , vì vậy nếu x > 5 , chúng tôi sẽ giữ nó, và nếu không, chúng tôi trao đổi nó" Tôi vẫn chưa xem.dxxyx>5

Tôi đã bị đánh lừa bởi công thức pop-sci của vấn đề trong cuốn sách của Wapner ( Kỳ vọng bất ngờ: Sự tò mò của một quả cầu pha lê toán học ), trong đó nêu rõ

"Dù sao đi nữa, hãy chọn một số nguyên dương ngẫu nhiên" (Wapner gợi ý phân phối hình học - tung đồng xu cho đến khi những cái đầu tiên xuất hiện, lặp lại quy trình nếu ) "Nếu d > x đoán cao hơn và nếu d < x đoán thấp hơn. (...) Bạn sẽ đoán đúng hơn 50 phần trăm thời gian vì d chỉ đúng hơn 50 phần trăm thời gian! "d=xd>xd<xd


1
Liên quan rất chặt chẽ: stats.stackexchange.com/questions/95694
whuber

2
Điều này khác hoàn toàn với vấn đề hai phong bì theo nghĩa: (1) đối số được đưa ra để chuyển đổi trong vấn đề hai phong bì là sai lầm, lỗ hổng trong đối số có thể được nhìn thấy bằng cách thêm một Bayes trước trong khi (2) đối số được đưa ra bởi Wapner cho đặt cược của Blackwell là chính xác.
Matthew Gunn

Nếu số tiền trong phong bì là các yếu tố tùy ý của một tập hợp số S, thì điều kiện đủ và cần thiết để chiến lược của Wapner hoạt động là cho CDF của số bạn chọn sẽ tăng nghiêm ngặt trên S.
Tái lập lại

OK, tôi vẫn còn thiếu một cái gì đó - vui lòng xem EDIT 2 của tôi, nhưng nó trông như thể chúng ta có thể tung đồng xu và nó vẫn hoạt động, theo lý luận. Tôi sai ở đâu
tháng 1,

Câu trả lời:


8

Điều này được biết đến rộng rãi hơn như là vấn đề hai phong bì . Thông thường nhất là số tiền được đưa ra là 2 A nhưng không bắt buộc phải có trường hợp này.A2A

Một số điểm:

  1. Bạn không thể chọn một số nguyên ngẫu nhiên thống nhất *, nhưng phần được trích dẫn dường như không yêu cầu nó phải đồng nhất. Chọn một phân phối - không quan trọng nó là gì đối với đối số - miễn là nó có một số xác suất vượt quá bất kỳ giá trị hữu hạn nào.

  2. Sẽ không hợp lý khi chọn số nguyên với quy tắc quyết định được trích dẫn, bởi vì tiền rời rạc, điều đó có nghĩa là có cơ hội khác không d = x và không có gì được liệt kê cho trường hợp đó. (Hoặc cách khác, để sửa đổi quy tắc để chỉ định những việc cần làm khi chúng bằng nhau)d d=x

  3. Bỏ qua chuyện đó, bạn có thể chọn từ một số phân phối liên tục không âm - sau đó chúng ta không phải lo lắng về sự bình đẳng.d

* (Bạn cũng không thể chọn số nguyên không âm ngẫu nhiên thống nhất cũng như số nguyên dương ngẫu nhiên đồng nhất)


Nếu chúng ta nói rằng có giới hạn về số tiền tối đa, giả sử hoặc ít nhất là chúng ta chọn d từ 1 ... M , thì công thức sẽ rút ra lời khuyên tầm thường khi chọn E y nếu x < M / 2 và chọn E x nếu x > M / 2Md1...MEyx<M/2Exx>M/2

Nếu nó chỉ ra rằng phân phối ngẫu nhiên mà được chọn bao gồm M / 2 thì nó sẽ hoạt động (cung cấp cho bạn tốt hơn 50-50); nếu phân phối bị kẹt trong một nửa thì không.xM/2

Tuy nhiên, các phiên bản của trò chơi này lần đầu tiên tôi được trình bày là phong bì được trình bày bởi một người nào đó (có thể) tìm cách giảm thiểu thu nhập của bạn từ trò chơi. Chiến lược sử dụng phân phối để quyết định có chuyển sang phong bì khác hay không vẫn sẽ hoạt động trong trường hợp đó.


OK, điểm (1-3) đã thực hiện. Vì vậy, tôi được phép chọn phân phối ngẫu nhiên, không âm, liên tục của P ( d < x ) = P ( d > x ) , đúng không? Nhưng sau đó, quyết định chủ yếu dựa trên việc tung đồng xu ... tôi có sai không? dP(d<x)=P(d>x)
tháng 1,

Bạn không yêu cầu cả. Bạn chỉ cần một số xác suất khác không để có được giữa hai số tiền. P(d<x)=P(d>x)
Glen_b -Reinstate Monica

Có, nhưng tôi được phép xác định hàm mật độ cho như tôi muốn, phải không? Tôi làm điều đó để dẫn dắt cuộc tranh luận đến một kết luận vô lý. d
tháng 1,

bằng cách biến chiến lược của bạn thành chức năng của x, bạn sẽ không tạo cho mình lợi thế của việc đưa ra lựa chọn chính xác khi d nằm giữa x và y - bạn đang xác định cách thoát khỏi trò chơi. Nếu liên kết bạn đưa ra tuyên bố rằng một chiến lược như vậy sẽ hoạt động thì họ đã sai
Glen_b -Reinstate Monica

Điều gì, theo lý luận của Wapner, cấm tôi xác định hàm xác suất được sử dụng để lấy là hàm của x ? Chừng nào P ( d ( x , y ) ) > 0 , sau đó lập luận của mình nên vẫn còn làm việc, tôi sai? Nếu tôi sử dụng một bản phân phối liên tục, không âm bao gồm x (ví dụ phân bố đồng đều trên ( 1 , 2 x ) , sau đó tôi đảm bảo rằng đây là trường hợp. Và tôi vẫn đưa ra quyết định đúng nếu d ( x , y ) .dxP(d(x,y))>0x(1,2x)d(x,y)
tháng 1,

7

Lập luận của Wapner là chính xác!

Một vài bình luận:

  • Theo chiến lược cắt giảm được mô tả trong đó chúng tôi chuyển đổi phong bì nếu tệ nhất là vô dụng trong kỳ vọng trước đây. Với một lựa chọn tốt của d , nó có thể khá hữu ích.x<dd
  • Nếu bạn thêm một Bayesian trước (nghĩa là bạn thêm niềm tin về việc phân phối tiền ban đầu trong phong bì), bạn có thể giải quyết giá trị tối ưu của với niềm tin trước đó của bạn.d
  • Trong một số tình huống nhất định (ví dụ: nếu bạn càng quan sát nhiều, bạn càng có nhiều khả năng nhận được phong bì lớn), chiến lược cắt giảm thậm chí còn tối ưu.
  • Trong một khung cảnh Bayes tổng quát hơn, bạn có thể làm tốt hơn một chiến lược cắt giảm đơn giản cho nhiều linh mục.

Một vấn đề liên quan nhưng khác nhau:

Như một số @Glen_b và @whuber đã đề cập, có một câu đố liên quan được gọi là Vấn đề hai phong bì , trong đó có một lý lẽ ngụy biện được đưa ra để luôn chuyển đổi phong bì và lỗ hổng trong tranh luận có thể được nhìn thấy bằng cách tiếp cận Bayesian và thêm niềm tin trước đó vào nội dung của hai phong bì.

Trong một số ý nghĩa, câu đố được mô tả ở đây là khá khác nhau. Lập luận của Wapner là chính xác!


1
OK, bây giờ tôi thấy nghịch lý đến từ đâu. Hoặc, cụ thể, nơi thông tin bổ sung chảy vào hệ thống. Bằng cách chọn một cách có ý thức phân phối d , chúng tôi sử dụng kiến ​​thức tiên nghiệm của mình về nơi, ít nhiều, số tiền trong cả hai phong bì nên được. Trường hợp xấu nhất, kiến ​​thức của chúng tôi là vô ích, nhưng phương pháp đảm bảo rằng chúng tôi sẽ không gặp bất lợi nếu sử dụng nó.
tháng 1,

Sau một số suy nghĩ, tôi vẫn không hiểu - xem EDIT 2.
tháng 1,

Kịch bản (A) Hãy tưởng tượng phong bì nhỏ có và phong bì lớn có 20 . Hãy chọn d = 15. P ( x < d ) = P ( x > d ) . Quy tắc quyết định sẽ đưa bạn đến sự lựa chọn chính xác 100% thời gian! 1020dP(x<d)=P(x>d)
Matthew Gunn

Bây giờ hãy xem xét một số Kịch bản (B). Hãy tưởng tượng phong bì nhỏ có số đô la lẻ từ 1 đến 9 (ví dụ: 1 hoặc 3 hoặc 5 hoặc 7 hoặc 9) và phong bì lớn có thêm 1 đô la. Chọn và sau đó P ( x < d ) = P ( x > d ) . Tuy nhiên, ở đây, repick của bạn nếu quy tắc quyết định < 5.5 không hữu ích! Nó dẫn đến quyết định đúng đắn nếu x = 1 , 3 , 5 , 6 , 8 , hoặc 10 và quyết định sai lầm nếu xd=5.5P(x<d)=P(x>d)<5.5x=1,3,5,6,8,10 . Nhớ lại các cặp có thể là (1,2), (3, 4), (5, 6), (7, 8) (9, 10) $ Điều BAYESIAN TỐI ƯU để biết phân phối ban đầu này là lặp lại nếu bạn thấy số tiền lẻ. x=2,4,7,9
Matthew Gunn

xyxdd

0

Tôi bị thu hút bởi điều này và đã sử dụng cách tiếp cận thực tế khi chơi với nó trong Excel.

Tôi đã tạo ba số ngẫu nhiên cho x, y và d trong phạm vi 1-100. Sau đó tôi đã so sánh giữa d và x và giữa x và y và xem kết quả, đúng hay sai.

Tôi đã làm điều này 500 lần và lặp đi lặp lại nhiều lần và thường xuyên có câu trả lời đúng với khoảng 330 trên 500, như dự đoán.

Sau đó tôi tăng phạm vi d lên 1-10000 và câu trả lời đúng giảm xuống còn khoảng 260 cho 500 lần chạy.

Vì vậy, có, việc lựa chọn d phụ thuộc vào giá trị dự kiến ​​của x và y.

BoB


0

Tôi nghĩ nghịch lý rõ ràng với việc mở rộng Wapner của phương trình p + (1-p) / 2 là nó giả định rằng (1-p) / 2> 0. Đối với nhiều phạm vi của d, giá trị này là 0.

Ví dụ: bất kỳ d được chọn từ phân phối đối xứng tập trung vào giá trị trong đường bao mở, đưa ra xác suất sai 1/2 và đúng 1/2.

Bất kỳ phân phối được chọn không đối xứng nào xuất hiện sai lệch lựa chọn sai 1/2 thời gian.

Vì vậy, có cách nào để chọn một phạm vi và phân phối cho d sao cho phương trình này giữ?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.