Nghịch lý phong bì


8

Có hai phong bì. Một cái chứa x tiền và cái kia chứa 2x số tiền. Số tiền chính xác " x " là không xác định đối với tôi, nhưng tôi biết những điều trên. Tôi chọn một phong bì và tôi mở nó ra. Tôi thấy y tiền trong đó, rõ ràng là nơi y{x,2x} .

Bây giờ tôi được đề nghị giữ hoặc chuyển phong bì.

Giá trị chuyển đổi dự kiến ​​là (122y+1212y)=54y. Giá trị dự kiến ​​của việc giữ phong bì của tôi là.y

Có vẻ như tôi nên luôn luôn chuyển phong bì. Hai câu hỏi của tôi:

Liệu lý luận này có đúng không?

Có khác gì không nếu tôi không được phép mở phong bì và xem số tiền , và sau đó tôi được cung cấp tùy chọn chuyển đổi vô thời hạn?y



1
Bạn không thể chỉ mong đợi, bạn nên bắt đầu với niềm tin về x và cập nhật niềm tin của bạn theo quy tắc của Bayes. Khi bạn nhìn thấy y, niềm tin của bạn về phong bì bạn đã mở sẽ thay đổi.
HRSE

Say x được phân bố đều giữa 0 và . Rồi sao?
Kỵ binh Kitsune

@KitsuneCavalry Không có sự phân phối như vậy. (Xin vui lòng gửi cho tôi một chương trình tạo phân phối như vậy.) Trong thực tế, không có giải pháp nào tạo ra niềm tin pior đưa ra trong câu hỏi của bạn cho tất cả các giá trị của . Trong liên kết của Herr K., điều này được giải thích trong en.wikipedia.org/wiki/y
Kẻ

3
@Kitsune Kỵ binh Phân phối đồng đều trên nửa dòng (hoặc toàn bộ dòng) là một sự không phù hợp nổi tiếng trước khi thống kê Bayes, xem phần thống kê hương vị.stackexchange.com / a/97790/28746
Alecos Papadopoulos

Câu trả lời:


5

Dưới đây là cách tiếp cận "tối đa hóa tiện ích / lý thuyết trò chơi" đối với vấn đề này (với một chút xác suất lý thuyết tập hợp). Trong một khuôn khổ như vậy, các câu trả lời xuất hiện rõ ràng.

CƠ SỞ

Chúng tôi được thông báo một cách trung thực tuyệt đối rằng, với một lượng tiền tệ dương, hai vé sau được đặt trong một hộp: { A = x , B = 2 x } với số nhận dạng được gán 1{ A = 2 x , B = x } với số nhận dạng được gán 0 . Sau đó, một kết quả rút ra từ biến ngẫu nhiên Bernoulli ( p = 0,5 ) đã được thực hiện và dựa trên kết quả và sự kiện đã xảy ra, số tiền xx{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x được đặt trong phong bì Một B . Chúng tôi không được cho biết giá trị của x là bao nhiêu, hoặc số tiền đã đi đến phong bì nào.2xABx

CASE đầu tiên: Chọn một phong bì với tùy chọn để chuyển đổi mà không cần mở nó

Vấn đề đầu tiên là làm thế nào để chúng ta chọn một phong bì ? Điều này phải làm với sở thích. Vì vậy, giả sử rằng chúng tôi dự kiến ​​tối đa hóa tiện ích, với chức năng tiện ích .u()

Chúng ta có thể mô hình hóa cấu trúc xác suất ở đây bằng cách xem xét hai biến ngẫu nhiên nhị phân, B đại diện cho các phong bì và số lượng trong đó. Hỗ trợ của mỗi là { x , 2 x } . Nhưng họ không độc lập. Vì vậy, chúng ta phải bắt đầu với việc phân phối chung. Ở dạng bảng, phân phối chung và phân phối biên tương ứng làAB{x,2x}

A/Bx2xMarg Ax00.50.52x0.500.5Marg B0.50.51.00

Điều này cho chúng ta biết rằng B có phân phối biên giống hệt nhau.AB

Nhưng điều này có nghĩa là không quan trọng chúng ta chọn phong bì như thế nào, bởi vì chúng ta sẽ luôn nhận được cùng một tiện ích mong đợi ,

0.5u(x)+0.5u(2x)

Những gì chúng ta đang phải đối mặt ở đây là một canh bạc hỗn hợp (cách chọn một phong bì) trên hai canh bạc giống nhau (mỗi phong bì). Chúng ta có thể chọn với xác suất 1 , 0 hoặc bất kỳ thứ gì ở giữa (và bổ sung cho B ). Nó không thành vấn đề. Chúng tôi sẽ luôn nhận được cùng một tiện ích mong đợi. Lưu ý rằng thái độ của chúng tôi đối với rủi ro không đóng vai trò ở đây.A10B

Vì vậy, chúng tôi chọn một phong bì, nói , và chúng tôi đang xem xét nó. Bây giờ tiện ích mong đợi của chúng ta là gì? Chính xác giống như trước khi lựa chọn . Chọn một phong bì bằng mọi cách, không ảnh hưởng đến xác suất của những gì bên trong.A

Chúng tôi được phép chuyển đổi. Giả sử chúng ta làm, và bây giờ chúng tôi đang nắm giữ phong bì . Bây giờ là những tiện ích được mong đợi là gì? Chính xác như trước đây .B

Đây là hai trạng thái có thể của thế giới đối với chúng tôi: chọn hoặc chọn B . Trong bất kỳ lựa chọn nào, cả hai quốc gia trên thế giới đều có cùng một giá trị đối với lực lượng lái xe được chọn / giả định của chúng tôi (nghĩa là tối đa hóa tiện ích dự kiến).AB

Vì vậy, ở đây, chúng tôi thờ ơ với chuyển đổi. và trên thực tế chúng ta cũng có thể chọn ngẫu nhiên.

TRƯỜNG HỢP thứ 2: MỞ MỨC ĐỘ với tùy chọn chuyển đổi sau

Giả sử bây giờ chúng ta đã chọn , mở nó và tìm thấy bên trong số tiền y { x , 2 x } . Điều này có thay đổi mọi thứ không? Ay{x,2x}

Hãy xem nào. Tôi tự hỏi, cái gì vậy

P(A=xA{x,2x})=?

Chà, là không gian mẫu mà trên đó biến ngẫu nhiên A được xác định. Điều hòa trên toàn bộ không gian mẫu, tức là trên đại số sigma tầm thường, không ảnh hưởng đến xác suất, cũng như các giá trị dự kiến. Như thể chúng ta tự hỏi "giá trị của A là gì nếu chúng ta biết rằng tất cả các giá trị có thể đã được nhận ra?" Không có kiến ​​thức hiệu quả đã đạt được, vì vậy chúng tôi vẫn ở cấu trúc xác suất ban đầu. {x,2x}AA

Nhưng tôi cũng tự hỏi, cái gì vậy

P(B=xA{x,2x})=?

Báo cáo kết quả điều, xem đúng là một đại số sigma tạo ra bởi các sự kiện , là không gian mẫu sản phẩm toàn bộ mà trên đó các vector ngẫu nhiên ( A , B ) đã được xác định. Từ bảng phân phối chung ở trên, chúng ta có thể thấy rằng phân bổ xác suất của khớp tương đương với phân bổ xác suất của các biên (tiêu chuẩn "gần như chắc chắn" do sự hiện diện của hai sự kiện có số đo bằng 0). Vì vậy, ở đây chúng tôi về cơ bản điều kiện xác suất cho B{A{x,2x}}(A,B)Btrên toàn bộ không gian mẫu của nó. Nó sau đó hành động của chúng tôi để mở phong bì không ảnh hưởng đến cấu trúc xác suất cho cũng có.B

Nhập lý thuyết trò chơi, bên cạnh việc ra quyết định. Chúng tôi đã mở phong bì, và chúng tôi phải quyết định xem chúng tôi sẽ chuyển đổi hay không. Nếu chúng ta không chuyển đổi, chúng ta sẽ có được tiện ích . Nếu chúng ta chuyển đổi, thì chúng ta đang ở trong hai trạng thái có thể có của thế giới sau đâyu(y)

y = 2 x , u ( A ) = u ( 2 x )

y=x,u(A)=u(x)u(B)=u(2x)
y=2x,u(A)=u(2x)u(B)=u(x)

Chúng tôi không biết trạng thái nào thực sự nắm giữ, nhưng theo các cuộc thảo luận ở trên, chúng tôi biết rằng mỗi trạng thái có xác suất hiện có. p=0.5

Chúng ta có thể mô hình hóa trò chơi này như một trò chơi trong đó đối thủ của chúng ta là "thiên nhiên" và ở đó chúng ta biết rằng thiên nhiên chơi một cách chắc chắn một chiến lược ngẫu nhiên : với y = x và với p = 0,5 , y = 2 x . Nhưng chúng tôi cũng bây giờ nếu chúng tôi không chuyển đổi, mức chi trả của chúng tôi là chắc chắn. Vì vậy, đây là trò chơi của chúng tôi ở dạng bình thường, với số tiền chi trả của chúng tôi:p=0.5 y=xp=0.5y=2x

We/naturey=xy=2xSwitchu(2x)u(x)Don't Switchu(y)u(y)

Chúng ta nên chống lại sự cám dỗ để thay thế u ( 2 x ) cho u ( y ) . u ( y ) là một khoản hoàn trả đã biết và nhất định. Tiền chi trả cho chiến lược "Chuyển đổi" thực sự không được biết đến (vì chúng tôi không biết giá trị của x ). Vì vậy, chúng ta nên đảo ngược sự thay thế . Nếu y = x thì u ( 2 x ) = u ( 2 y ) và nếuu(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y) thì u ( x ) = u ( y / 2 ) . Vì vậy, đây là trò chơi của chúng tôi một lần nữa:y=2xu(x)=u(y/2)

We/naturey=xy=2xSwitchu(2y)u(y/2)Don't Switchu(y)u(y)

Bây giờ tất cả các khoản thanh toán trong ma trận đã được biết đến. Có một chiến lược chi phối thuần túy?

Mức chi trả dự kiến ​​của chiến lược "Switch" là

E(VS)=0.5u(2y)+0.5u(y/2)

Phần thưởng dự kiến ​​của chiến lược "Đừng chuyển đổi" là

E(VDS)=u(y)

Chúng ta nên chuyển đổi nếu

E(VS)>E(VDS)0.5u(2y)+0.5u(y/2)>u(y)

bây giờ , thái độ đối với rủi ro trở nên quan trọng. Không khó để suy luận rằng dưới hành vi trung lập chấp nhận rủi ro và rủi ro, chúng ta nên chuyển đổi.

Liên quan đến hành vi không thích rủi ro , tôi thấy một kết quả tao nhã:

Đối với các hàm tiện ích "ít lõm" (đúng ở trên) so với logarit (giả sử căn bậc hai), thì chúng ta vẫn nên Chuyển.

u(y)=lny

Đối với "nhiều lõm" hơn (hoàn toàn bên dưới) các hàm tiện ích logarit, chúng ta không nên chuyển đổi.

Tôi đóng với sơ đồ của trường hợp logarit

nhập mô tả hình ảnh ở đây

Giả sử . Khi đó . Dòng là dòng mà tiện ích dự kiến ​​từ "Chuyển đổi" sẽ nằm. Vì thiên nhiên đóng một chiến lược , nên nó thực sự sẽ ở điểm , là điểm giữa . Tại thời điểm đó với tiện ích logarit, chúng tôi nhận được chính xác cùng một tiện ích từ "Đừng chuyển đổi", tức là cho ví dụ số này.y / 2 = 2 , 2 y = 8y=4y/2=2,2y=8 50 - 50 Δ Γ - Δ - Ε ln ( 4 )ΓΔΕ5050ΔΓΔΕln(4)


Gọi "ác cảm rủi ro" thông qua chức năng tiện ích logarit không giải quyết được nghịch lý. Như @HRSE đã lưu ý, sử dụng định lý Bayes, xác suất mà số tiền chi trả là và không phải là 0,5 sau khi nhìn thấy số tiền trong phong bì đầu tiên. Điều này chỉ giữ cho đồng phục có nhiều nghi vấn không phù hợp trước đó (với ). Nếu sử dụng đúng trước (phản ánh niềm tin của một người về ), giải pháp sẽ chuyển sang nếu đủ nhỏ và giữ phong bì đầu tiên nếu đủ lớn. Xem jstor.org/ ổn định / 2.685.310 .u ( y / 2 x x > 0 x x y yu(2y)u(y/2xx>0xxyy
Jarle Tufto

@JarleTufto Theo cách tôi nhìn thấy, đồng phục trước là chính xác trước, nếu người ta quyết định tin vào ban tổ chức trò chơi, khi họ nói rằng số tiền đã được đưa vào phong bì sau khi rút Bernoulli với . Nếu một người muốn nghi ngờ, không tin vào ban tổ chức và hình thành một số niềm tin trước đó, thì đó là quyền của anh ta, nhưng anh ta sẽ phải đưa ra một số lý lẽ để thuyết phục tôi về việc a) tại sao ban tổ chức lại nói dối và b) làm thế nào anh ấy chọn khác nhau trước khi anh ấy chọn. Lưu ý rằng câu trả lời của tôi giả định rằng chúng tôi tin rằng các nhà tổ chức về vấn đề này. p=0.5
Alecos Papadopoulos

Tất nhiên tôi đồng ý rằng bạn được cấp cho mỗi phong bì chứa số lượng và tương ứng với xác suất bằng nhau bằng 1/2. Điều tôi đang nói là đồng phục ngầm không phù hợp trước mà bạn sử dụng, nghĩa là, , với tất cả dẫn đến nghịch lý vì định lý Bayes dẫn đến trong đó là lượng quan sát được trong đường bao đầu tiên. Thay vào đó, sử dụng một thích hợp , các xác suất có điều kiện này khác nhau và quyết định tối ưu phụ thuộc vào (và tất nhiên là chức năng tiện ích). 2 X X π ( x ) = 1 x > 0 P ( X = y | Y = y ) = P ( X = y / 2 | Y = y ) = 1 / 2 y π ( x ) yX2XXπ(x)=1x>0P(X=y|Y=y)=P(X=y/2|Y=y)=1/2yπ(x)y
Jarle Tufto

@JarleTufto Điều này không đúng trước khi bạn đề cập, nó phản ánh xác suất liên quan đến những gì?
Alecos Papadopoulos

Số tiền trong hai phong bì là và . Phân phối xác suất trước thể hiện niềm tin của bạn về trước khi mở bất kỳ phong bì nào. Bạn đang ngầm sử dụng cụ thể này trước hoặc bạn đang phạm phải sai lầm khi đánh đồng các xác suất có điều kiện ngược. 2 X XX2XX
Jarle Tufto

0

Nếu bạn mở phong bì E1 , và thấy rằng giá trị của nó là E1 = Y , sau đó đúng là phong bì khác E2 giá trị 's là trong {E2 = Y / 2, E2 = 2Y} .

Cũng đúng là giá trị mong đợi của phong bì đó là (Y / 2) * Pr (E2 = Y / 2) + (2Y) * Pr (E2 = 2Y) .

Lỗi là giả sử rằng Pr (E2 = Y / 2) = Pr (E2 = 2Y) = 1/2 bất kể Y là gì . Một cách đơn giản để thể hiện điều này, là giả định rằng mỗi phong bì chứa tiền giấy của Hoa Kỳ có nhiều mệnh giá khác nhau. Nếu Y = $ 1 , thì E2 không thể là Y / 2 .

Một bằng chứng khắt khe hơn là quá chi tiết để cung cấp ở đây, nhưng tóm tắt về nó trước tiên là giả sử rằng, với bất kỳ giá trị Z nào , Pr (Z / 2 <= E2 <Z) = Pr (Z <= E2 <2Z) . Đây thực chất là cùng một giả định như trong đoạn cuối, được mở rộng thành một loạt các giá trị. Nhưng nếu điều này đúng với bất kỳ giá trị nào của Z , điều đó có nghĩa là Pr (Z * 2 ^ (N-1) <= E2 <Z * 2 ^ (N-1)) là hằng số cho mọi giá trị của N , từ -inf đến inf. Vì điều đó là không thể, nên giả định không thể đúng.

+++++

Điều đó có thể hơi khó hiểu, vì vậy hãy để tôi thử một ví dụ. Bạn được tặng hai bộ hai phong bì. Trong một bộ, chúng chứa 10 và 20 đô la. Mặt khác, chúng chứa 20 và 40. Bạn chọn một bộ, sau đó mở một phong bì trong bộ đó để tìm 20. Sau đó, bạn được cung cấp cơ hội để chuyển sang phong bì khác trong bộ đó. Bạn có nên

Có, nên chuyển đổi. Mức tăng dự kiến ​​bằng cách chuyển sang phong bì khác là [(20-10) + (20-40)] / 2 = +5.

Lưu ý rằng trường hợp này - nghĩa là, bạn biết rằng bạn đã tìm thấy 20, chứ không phải 10 hoặc 40, phù hợp với các điều kiện bạn mô tả trong câu hỏi của mình. Vì vậy, giải pháp của bạn hoạt động. Nhưng bản thân thí nghiệm không phù hợp với mô tả đó. Nếu bạn đã tìm thấy 10, hoặc nếu bạn đã tìm thấy 40, xác suất phong bì khác có 20 là 100%. Mức tăng dự kiến ​​lần lượt là +10 và -20. Và nếu bạn tính trung bình ba mức tăng có thể có trong các xác suất bạn sẽ nhận được ba giá trị, bạn sẽ nhận được 10/4 + 5/2 - 20/4 = 0.


Tại sao tôi cho rằng một phong bì không thể có 50 xu trong đó? Ngoài ra, câu hỏi đặc biệt là hỏi về những lúc bạn không biết số tiền có thể có trong đó, chỉ là số tiền tương đối có thể, vì vậy tôi không thực sự theo dõi điều này.
Kỵ binh Kitsune

Tôi nói đó là một cách tiếp cận đơn giản. Nó bắt đầu với 'giả sử rằng mỗi phong bì chứa tiền giấy của Hoa Kỳ.' Vì bạn không thể có 50 xu tiền giấy ở Hoa Kỳ, Pr (E2 = 1) = 1. Vấn đề là, giả sử Y / 2 và 2Y có khả năng như nhau, khi bạn không biết Y, sẽ giả sử phân phối thực tế cho Y là không thể đạt được. 2|E1=
JeffJo

0

Nói chung, vấn đề là không thể giải quyết được vì bạn chưa chỉ định quy trình ngẫu nhiên của toàn bộ thử nghiệm.

Nhưng hãy để Y là giá trị của phong bì bạn đã chọn và X là phong bì khác. Câu trả lời là - đó là một kỳ vọng có điều kiện . Tuy nhiên, giả sử một phân phối chung nhất của Y, Y được rút ra đồng đều từ tất cả . Nhưng sau đó , và do nghịch lý Borelog Kolmogorov của Borel, kỳ vọng là không thể giải quyết được.E[X|Y=y]R P r ( Y = y ) = 0RPr(Y=y)=0


@JeffJo, tôi không thể bình luận dưới bài viết của bạn do không có đủ danh tiếng. Tôi đã thêm câu trả lời này vì tôi tin rằng nó liên quan đến bài viết của bạn.
John Rambo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.