Trò chơi đoán số


7

Tôi đã giải quyết câu hỏi này . Nó là như sau

Joe chọn một số nguyên từ danh sách với một xác suất của chọn cho tất cả . Sau đó, anh ta cho Jason cố gắng đoán số của mình. Mỗi lần đoán, Joe sẽ nói với Jason nếu số của anh ta cao hơn hoặc thấp hơn dự đoán của Jason. Nếu Jason đoán đúng số của Joe trên bất kỳ số đoán , trò chơi sẽ chấm dứt và Jason thắng. Jason thua khác. Nếu Jason biết tất cả và chơi tối ưu, xác suất anh ta thắng là bao nhiêu? 1,2,,NpTôiTôi1TôiNKKpTôi'S
1N200000
1K20

Tôi đã thử vấn đề này bằng lập trình động. Hãy để lưu trữ xác suất chiến thắng sao cho số đó nằm trong khoảng từ đến và chỉ còn lại cơ hội. Vì vậy Nhưng vì phạm vi của N là rất cao giải pháp này là không khả thi. Vì vậy, trong khi tôi đang tìm kiếm một giải pháp \ mathcal {O} (n), tôi đã tìm thấy giải pháp sau (trên internet được chấp nhận)DP[Tôi][j][k]Tôijk

DP[Tôi][j][k]= =tối đaTôitôij{ptôi+DP[Tôi][tôi-1][k-1]+DP[tôi+1][j][k-1]}DP[Tôi][j][1]= =tối đaTôitôijptôi Trường hợp cơ sở
NÔi(n)
  • Sắp xếp ( p[] )
  • i=0min(n,2k1)pi

Nếu chúng ta chạy cả hai giải pháp trên đầu vào chúng ta sẽ có cùng một câu trả lời. Vì vậy, câu hỏi của tôi là thuật toán trên hoạt động như thế nào và chúng ta có thể đi đến cùng một kết luận bắt đầu từ công thức dp của tôi {nếu nó đúng}.N=5,K=2,p=[0.2,0.3,0.4,0.1,0.0]


Trường hợp cơ bản của bạn và giải pháp bạn tìm thấy dường như không phải là chiến lược tối ưu với tôi.
Được thông báo vào

@randomA tại sao? Nếu chúng ta chỉ có một cơ hội thì chiến lược tối ưu sẽ là chọn con số có xác suất cao nhất.
giải đấu công lý

Bạn đúng rồi. Trường hợp cơ bản là đúng, tôi không hiểu giải pháp của bạn. Lấy làm tiếc.
Được thông báo vào

Câu trả lời:


2

Lý do tại sao giải pháp sắp xếp hoạt động là nếu bạn được đưa ra K đoán, sau đó với bất kỳ chiến lược xác định nào, bạn chỉ có thể đoán tối đa 2K-1các giá trị. Điều này có thể được chứng minh bằng cảm ứng, đầu tiên lưu ý trường hợp cơ sởK= =1 và sau đó cho K+1, lưu ý rằng sau khi bạn đoán giá trị đầu tiên thì bạn có K đoán bên trái và bạn đoán ở bên trái hoặc bên phải dự đoán ban đầu của bạn tùy thuộc vào kết quả của dự đoán ban đầu, do đó, bằng cách cảm ứng đưa ra 2(2K-1) các giá trị bạn có thể đoán sau lần đầu tiên, vì vậy nếu bạn thêm dự đoán ban đầu thì bạn sẽ nhận được 2K+1-1.

Hơn nữa, nếu có 2K-1giá trị là giá trị chính xác, nó sẽ được đoán và bạn sẽ thắng. Không ai khácN-2K+1giá trị sẽ không bao giờ được đoán. Vì vậy, xác suất bạn thắng là tổng xác suất của2K-1giá trị chiến lược xác định của bạn có thể đoán. Rõ ràng giải pháp tối ưu là đi đầu2K-1 xác suất.


0

Sau một vài tháng, đầu của tôi đã trở nên rõ ràng hơn và dường như khá dễ dàng để xem cách thức hoạt động của nó.

Nếu bạn có 1 lần đoán, bạn chọn một người có xác suất cao nhất.

Nếu bạn có 2 lần đoán, bạn chọn 3 với xác suất cao nhất. Đoán đầu tiên, bạn chọn cái thứ hai trong số ba. Lựa chọn thứ hai, bạn được hướng đến một trong hai bên của lựa chọn đầu tiên. Mỗi bên dẫn đến trường hợp 1 lần đoán và ở mỗi bên bạn đã có 2 đầu dò hàng đầu nằm ở mỗi bên. Điều này là tối ưu. Xác suất chiến thắng là tổng của 3 thăm dò.

..

Vì vậy, mô hình rõ ràng là khi bạn có k đoán, bạn chọn đầu 2k-1với xác suất cao nhất. Lựa chọn đầu tiên là ở giữa đỉnh2k-1. Sau đó, bạn tái diễn ở hai bên của một giữa. Ở hai bên, bạn có đỉnh(2k-1)-12= =2k-1-1 xác suất nằm ở đó bởi vì cách bạn chọn trục giữa và bạn đi đầu 2k-1.

Điều này đưa ra xác suất để chiến thắng là tổng của đầu 2k-1 xác suất.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.