Giá thầu ngẫu nhiên tối ưu


7

Câu hỏi này xuất phát từ trang web này mà tôi thường xuyên xem qua.

Hai người chơi tham gia một chương trình trò chơi mới hấp dẫn có tên là Thắng số cao hơn. Cả hai đi vào các gian hàng riêng biệt và mỗi người nhấn một nút và một số ngẫu nhiên giữa 0 và một xuất hiện trên màn hình. (Tại thời điểm này, không biết số của người khác, nhưng họ không biết số được chọn từ phân phối đồng phục tiêu chuẩn.) Họ có thể chọn giữ số đầu tiên đó hoặc nhấn lại nút để loại bỏ số đầu tiên và nhận số thứ hai số ngẫu nhiên, mà họ phải giữ. Sau đó, họ ra khỏi gian hàng của họ và xem số cuối cùng cho mỗi người chơi trên tường. Giải thưởng lớn xa hoa - một trường hợp đầy vàng thỏi - được trao cho người chơi giữ số cao hơn. Số nào là mức cắt tối ưu để người chơi loại bỏ số đầu tiên của họ và chọn số khác? Đặt một cách khác, trong phạm vi mà họ nên chọn để giữ số đầu tiên,

Đây là một vấn đề đấu giá rất kỳ lạ với những người chơi đối xứng (tôi cũng cho rằng những người chơi trung lập với rủi ro) hoặc một trò chơi xổ số / trò chơi lý thuyết rất kỳ quặc.

Làm thế nào bạn sẽ tiếp cận câu hỏi này về mặt toán học và câu trả lời nào bạn nhận được cho nó? Không có giải thưởng cho tôi để có câu trả lời đúng cho câu đố của trang web, tôi chỉ tò mò. Trực giác của tôi nói với tôi rằng mức cắt tối ưu là 0,5, vì bạn có 50-50 cơ hội cao hơn hoặc thấp hơn số của đối thủ, bất kể anh ấy / cô ấy có lặp lại số ngẫu nhiên của họ hay không, nhưng tôi không chắc.


Tôi không nghĩ rằng tính trung lập rủi ro có liên quan đến điều này, người chơi chỉ cần cố gắng tối đa hóa xác suất chiến thắng của họ. Tiền chi trả là nhị phân, không có kết quả trung bình an toàn.
Giskard

@denesp Bạn có thể không thích rủi ro theo nghĩa là nếu bạn muốn rút ra 0,46, bạn có thể không muốn vẽ lại mặc dù bạn có cơ hội nhận được số tốt hơn so với số kém hơn.
Kỵ binh Kitsune

1
@KitsuneCavalry Tôi thấy những gì bạn đang nói, nhưng đó sẽ là một số khái niệm "hành vi" về ác cảm rủi ro, vì nó được xác định qua một bước tạm thời thay vì kết quả cuối cùng.
Shane

@Shane Chắc chắn, tôi nghe thấy bạn. Và dù sao tôi cũng không quá lo lắng về điều đó.
Kỵ binh Kitsune

Câu trả lời:


6

Đầu tiên tôi sẽ chỉ cho thấy 0,5 (hoặc 12 ) điểm giới hạn không hoạt động như một điểm cân bằng đối xứng, sau đó bạn có thể tự quyết định nếu bạn muốn nghĩ về vấn đề hoặc đọc câu trả lời hoàn chỉnh.

Hãy để chúng tôi biểu thị các điểm giới hạn bởi cx,cy . Giả sử cả hai người chơi sử dụng chiến lược c=12 . Hãy để chúng tôi biểu thị số lượng người chơixytương ứng làx1y1và số thứ hai tiềm năng của họ bằngx2y2. Giả sửx1=23 . Bằng cách giữ xác suất này, người chơixthắng là

P(12y1<23)+P(y1<12)P(y2<23)=16+1223=12.
Điều này cũng có nghĩa là23trung vị của phân phối này.

Bây giờ giả sử x1=12x

P(y1<12)P(y2<12)=1212=14
x1=12
P(y1<12)P(x2>y2)+P(y112)P(x2>y1)=38
38>14x1=12


ALO SPOILER

ycyxx1=cyx

P(y1<cy)P(y2<cy)=cycy=cy2.
xx1
P(y1cy)P(x2>y1)+P(y1<cy)P(x2>y2)=(1cy)(11+cy2)+cy12
cx=cy=c

x1cx1=cx1
P(y1<c)P(y2<c)=P(y1c)P(x2>y1)+P(y1<c)P(x2>y2)cc=(1c)(11+c2)+c12c2=12c+c22+c212c2+c212=0c=512.


Ai đó đã thực hiện một dẫn xuất tương tự như bạn, và đã thực hiện phép tính Wolfram này để kiểm tra lại: tinyurl.com/j9xey5t Vì vậy, tôi sẽ tiếp tục và nói điều này có vẻ đúng. Bây giờ nếu bạn giải quyết được hình thức chung của trò chơi này, tôi sẽ cho bạn câu trả lời hay nhất: P Kidding ~ (Mặc dù sẽ rất thú vị khi xem trò chơi thay đổi như thế nào với nhiều cơ hội để quay lại.) Việc cắt bỏ chỉnh sửa của bạn có nghĩa là cả hai người chơi có 50 % chiến thắng, hoặc bạn vẫn nghĩ rằng có một lỗi trong câu trả lời của bạn?
Kỵ binh Kitsune

@KitsuneCavalry Tôi nghĩ rằng chấp nhận nó là hơi sớm nhưng may mắn là tính toán là chính xác và lý luận của tôi về 50% là sai. Điểm cắt cao đến mức vẽ nó là 'may mắn' và do đó bạn có cơ hội chiến thắng cao hơn 50% nếu bạn vẽ nó. Trước khi bốc thăm bạn có chính xác 50%.
Giskard

Nếu nó được tính cho bất cứ điều gì, trang web đưa ra câu hỏi đã đưa ra câu trả lời. Bạn đã nhận được nó trên tiền. Cảm thấy như một người chiến thắng ngày hôm nay. Bạn đã kiếm được B)
Kỵ binh Kitsune

2

c1c2c2c1p1(x)xp1(x)c1xx<c1c1x+xc1p2(x)p2(x)p1(x)0x1

  • (0,0)(c12,c1c2)0xc1
  • (c12,c1c2)(c1c2+c2c1,c22)c1xc2
  • (c1c2+c2c1,c22)(1,1)c2x1

12+12(c2c1)(c1c2+c21)

1c22c1c2+c22=01c1+2c2c12+2c1c2=0

(c2c1)(1+c1+c2)=0c1=c21c1c12=0c1=c2=512


Đây là một câu trả lời tuyệt vời nhưng tại sao bạn gọi trạng thái cân bằng là trạng thái cân bằng ổn định?
Giskard

1
@denesp Tôi đoán đó là dư thừa.
f ''
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.