Dưới đây là cách tiếp cận "tối đa hóa tiện ích / lý thuyết trò chơi" đối với vấn đề này (với một chút xác suất lý thuyết tập hợp). Trong một khuôn khổ như vậy, các câu trả lời xuất hiện rõ ràng.
CƠ SỞ
Chúng tôi được thông báo một cách trung thực tuyệt đối rằng, với một lượng tiền tệ dương, hai vé sau được đặt trong một hộp: { A = x , B = 2 x } với số nhận dạng được gán 1 và { A = 2 x , B = x } với số nhận dạng được gán 0 . Sau đó, một kết quả rút ra từ biến ngẫu nhiên Bernoulli ( p = 0,5 ) đã được thực hiện và dựa trên kết quả và sự kiện đã xảy ra, số tiền x vàx{A=x,B=2x}1{A=2x,B=x}0(p=0.5)x được đặt trong phong bì Một và B . Chúng tôi không được cho biết giá trị của x là bao nhiêu, hoặc số tiền đã đi đến phong bì nào.2xABx
CASE đầu tiên: Chọn một phong bì với tùy chọn để chuyển đổi mà không cần mở nó
Vấn đề đầu tiên là làm thế nào để chúng ta chọn một phong bì ? Điều này phải làm với sở thích. Vì vậy, giả sử rằng chúng tôi dự kiến tối đa hóa tiện ích, với chức năng tiện ích .u()
Chúng ta có thể mô hình hóa cấu trúc xác suất ở đây bằng cách xem xét hai biến ngẫu nhiên nhị phân, và B đại diện cho các phong bì và số lượng trong đó. Hỗ trợ của mỗi là { x , 2 x } . Nhưng họ không độc lập. Vì vậy, chúng ta phải bắt đầu với việc phân phối chung. Ở dạng bảng, phân phối chung và phân phối biên tương ứng làAB{x,2x}
A/B→x2xMarg Bx00.50.52x0.500.5Marg A0.50.51.00
Điều này cho chúng ta biết rằng và B có phân phối biên giống hệt nhau.AB
Nhưng điều này có nghĩa là không quan trọng chúng ta chọn phong bì như thế nào, bởi vì chúng ta sẽ luôn nhận được cùng một tiện ích mong đợi ,
0.5⋅u(x)+0.5⋅u(2x)
Những gì chúng ta đang phải đối mặt ở đây là một canh bạc hỗn hợp (cách chọn một phong bì) trên hai canh bạc giống nhau (mỗi phong bì). Chúng ta có thể chọn với xác suất 1 , 0 hoặc bất kỳ thứ gì ở giữa (và bổ sung cho B ). Nó không thành vấn đề. Chúng tôi sẽ luôn nhận được cùng một tiện ích mong đợi. Lưu ý rằng thái độ của chúng tôi đối với rủi ro không đóng vai trò ở đây.A10B
Vì vậy, chúng tôi chọn một phong bì, nói , và chúng tôi đang xem xét nó. Bây giờ tiện ích mong đợi của chúng ta là gì? Chính xác giống như trước khi lựa chọn . Chọn một phong bì bằng mọi cách, không ảnh hưởng đến xác suất của những gì bên trong.A
Chúng tôi được phép chuyển đổi. Giả sử chúng ta làm, và bây giờ chúng tôi đang nắm giữ phong bì . Bây giờ là những tiện ích được mong đợi là gì? Chính xác như trước đây .B
Đây là hai trạng thái có thể của thế giới đối với chúng tôi: chọn hoặc chọn B . Trong bất kỳ lựa chọn nào, cả hai quốc gia trên thế giới đều có cùng một giá trị đối với lực lượng lái xe được chọn / giả định của chúng tôi (nghĩa là tối đa hóa tiện ích dự kiến).AB
Vì vậy, ở đây, chúng tôi thờ ơ với chuyển đổi. và trên thực tế chúng ta cũng có thể chọn ngẫu nhiên.
TRƯỜNG HỢP thứ 2: MỞ MỨC ĐỘ với tùy chọn chuyển đổi sau
Giả sử bây giờ chúng ta đã chọn , mở nó và tìm thấy bên trong số tiền y ∈ { x , 2 x } . Điều này có thay đổi mọi thứ không? Ay∈{x,2x}
Hãy xem nào. Tôi tự hỏi, cái gì vậy
P(A=x∣A∈{x,2x})=?
Chà, là không gian mẫu mà trên đó biến ngẫu nhiên A được xác định. Điều hòa trên toàn bộ không gian mẫu, tức là trên đại số sigma tầm thường, không ảnh hưởng đến xác suất, cũng như các giá trị dự kiến. Như thể chúng ta tự hỏi "giá trị của A là gì nếu chúng ta biết rằng tất cả các giá trị có thể đã được nhận ra?" Không có kiến thức hiệu quả đã đạt được, vì vậy chúng tôi vẫn ở cấu trúc xác suất ban đầu. {x,2x}AA
Nhưng tôi cũng tự hỏi, cái gì vậy
P(B=x∣A∈{x,2x})=?
Báo cáo kết quả điều, xem đúng là một đại số sigma tạo ra bởi các sự kiện , là không gian mẫu sản phẩm toàn bộ mà trên đó các vector ngẫu nhiên ( A , B ) đã được xác định. Từ bảng phân phối chung ở trên, chúng ta có thể thấy rằng phân bổ xác suất của khớp tương đương với phân bổ xác suất của các biên (tiêu chuẩn "gần như chắc chắn" do sự hiện diện của hai sự kiện có số đo bằng 0). Vì vậy, ở đây chúng tôi về cơ bản điều kiện xác suất cho B{A∈{x,2x}}(A,B)Btrên toàn bộ không gian mẫu của nó. Nó sau đó hành động của chúng tôi để mở phong bì không ảnh hưởng đến cấu trúc xác suất cho cũng có.B
Nhập lý thuyết trò chơi, bên cạnh việc ra quyết định. Chúng tôi đã mở phong bì, và chúng tôi phải quyết định xem chúng tôi sẽ chuyển đổi hay không. Nếu chúng ta không chuyển đổi, chúng ta sẽ có được tiện ích . Nếu chúng ta chuyển đổi, thì chúng ta đang ở trong hai trạng thái có thể có của thế giới sau đâyu(y)
y = 2 x , u ( A ) = u ( 2 x )
y=x,u(A)=u(x)⟹u(B)=u(2x)
y=2x,u(A)=u(2x)⟹u(B)=u(x)
Chúng tôi không biết trạng thái nào thực sự nắm giữ, nhưng theo các cuộc thảo luận ở trên, chúng tôi biết rằng mỗi trạng thái có xác suất hiện có. p=0.5
Chúng ta có thể mô hình hóa trò chơi này như một trò chơi trong đó đối thủ của chúng ta là "thiên nhiên" và ở đó chúng ta biết rằng thiên nhiên chơi một cách chắc chắn một chiến lược ngẫu nhiên : với y = x và với p = 0,5 , y = 2 x . Nhưng chúng tôi cũng bây giờ nếu chúng tôi không chuyển đổi, mức chi trả của chúng tôi là chắc chắn. Vì vậy, đây là trò chơi của chúng tôi ở dạng bình thường, với số tiền chi trả của chúng tôi:p=0.5 y=xp=0.5y=2x
We/nature→SwitchDon't Switchy=xu(2x)u(y)y=2xu(x)u(y)
Chúng ta nên chống lại sự cám dỗ để thay thế và u ( 2 x ) cho u ( y ) . u ( y ) là một khoản hoàn trả đã biết và nhất định. Tiền chi trả cho chiến lược "Chuyển đổi" thực sự không được biết đến (vì chúng tôi không biết giá trị của x ). Vì vậy, chúng ta nên đảo ngược sự thay thế . Nếu y = x thì u ( 2 x ) = u ( 2 y ) và nếuu(x)u(2x)u(y)u(y)xy=xu(2x)=u(2y) thì u ( x ) = u ( y / 2 ) . Vì vậy, đây là trò chơi của chúng tôi một lần nữa:y=2xu(x)=u(y/2)
We/nature→SwitchDon't Switchy=xu(2y)u(y)y=2xu(y/2)u(y)
Bây giờ tất cả các khoản thanh toán trong ma trận đã được biết đến. Có một chiến lược chi phối thuần túy?
Mức chi trả dự kiến của chiến lược "Switch" là
E(VS)=0.5⋅u(2y)+0.5⋅u(y/2)
Phần thưởng dự kiến của chiến lược "Đừng chuyển đổi" là
E(VDS)=u(y)
Chúng ta nên chuyển đổi nếu
E(VS)>E(VDS)⟹0.5⋅u(2y)+0.5⋅u(y/2)>u(y)
Và bây giờ , thái độ đối với rủi ro trở nên quan trọng. Không khó để suy luận rằng dưới hành vi trung lập chấp nhận rủi ro và rủi ro, chúng ta nên chuyển đổi.
Liên quan đến hành vi không thích rủi ro , tôi thấy một kết quả tao nhã:
Đối với các hàm tiện ích "ít lõm" (đúng ở trên) so với logarit (giả sử căn bậc hai), thì chúng ta vẫn nên Chuyển.
u(y)=lny
Đối với "nhiều lõm" hơn (hoàn toàn bên dưới) các hàm tiện ích logarit, chúng ta không nên chuyển đổi.
Tôi đóng với sơ đồ của trường hợp logarit
Giả sử . Khi đó . Dòng là dòng mà tiện ích dự kiến từ "Chuyển đổi" sẽ nằm. Vì thiên nhiên đóng một chiến lược , nên nó thực sự sẽ ở điểm , là điểm giữa . Tại thời điểm đó với tiện ích logarit, chúng tôi nhận được chính xác cùng một tiện ích từ "Đừng chuyển đổi", tức là cho ví dụ số này.y / 2 = 2 , 2 y = 8y=4y/2=2,2y=8 50 - 50 Δ Γ - Δ - Ε ln ( 4 )Γ−Δ−E50−50ΔΓ−Δ−Eln(4)