Phiên bản giới hạn tính toán của cân bằng Nash?


14

Tôi tự hỏi liệu có một phiên bản giới hạn tính toán của khái niệm cân bằng Nash, một cái gì đó dọc theo các dòng sau.

Hãy tưởng tượng một loại trò chơi thông tin hoàn hảo gồm hai người chơi được chơi trên một bảng , và nó phức tạp theo nghĩa là chơi tối ưu là khó EXPTIME. Giả sử cũng đơn giản mà vẽ là không thể. Hãy tưởng tượng một cặp ( A , B ) các máy Turing ngẫu nhiên thời gian ngẫu nhiên chơi trò chơi này với nhau. Đối với mỗi n , chúng ta hãy p Một , B ( n ) là xác suất mà một nhịp đập B tại mỗi phiên n trò chơi. (Để cụ thể, hãy nói rằng An×n(Một,B)npMột,B(n)MộtBnMộtđược chơi đầu tiên với xác suất 0,5.) Những gì tôi nghĩ rằng sẽ thú vị là nếu người ta có thể chứng minh sự tồn tại của một cặp với tài sản đó không ngẫu nhiên thời gian đa thức Turing máy Một ' thống trị Một (nơi " Một ' chiếm ưu thế Một "có nghĩa là p Một ' , B ( n ) > p A , B ( n ) cho tất cả đủ lớn n ), và tương tự không ngẫu nhiên thời gian đa thức Turing máy B '(Một,B)Một' MộtMột'MộtpMột',B(n)>pMột,B(n)nB'chiếm ưu thế (nơi " B ' thống trị B " có nghĩa là p Một , B ' ( n ) < p Một , B ( n ) cho tất cả đủ lớn n ).BB'BpMột,B'(n)<pMột,B(n)n

Bằng cách nào đó, tôi nghi ngờ rằng điều này là quá nhiều để hy vọng, nhưng liệu có hy vọng nào cho những điều như thế này là sự thật, có lẽ đối với một lớp trò chơi bị hạn chế?

Một động lực cho câu hỏi này là tôi đang tìm cách để chính thức hóa quan niệm rằng một vị trí cờ nhất định là "lợi thế cho Trắng". Về mặt kinh điển, một vị trí là một chiến thắng cho Trắng hoặc không. Tuy nhiên, người chơi cờ, cả con người và máy tính, có một sự hiểu biết trực quan về ý nghĩa của việc White có lợi thế. Nó dường như có liên quan đến xác suất mà White sẽ giành chiến thắng, với điều kiện là các cầu thủ bị ràng buộc về mặt tính toán và phải đoán ở nước đi tốt nhất. Đối với một cặp thuật toán ngẫu nhiên cụ thể, dĩ nhiên người ta có thể nói về xác suất mà Trắng sẽ thắng, nhưng điều tôi băn khoăn là liệu có thể, theo một nghĩa nào đó, có thể là một kinh điển cặp người chơi bị ràng buộc tính toán có xác suất chiến thắng mang lại giá trị cho vị trí chỉ phụ thuộc vào chính trò chơi chứ không phụ thuộc vào đặc điểm riêng của người chơi.


Các khái niệm cân bằng bị ràng buộc về mặt tính toán mà tôi biết có một hương vị khác - nghĩ về Halpern, Pass và Seeman như trong Sự thật đằng sau Huyền thoại của Định lý Dân gian , 2014. Chúng ta không cho rằng việc tìm ra một chiến lược cân bằng cho trò chơi đã cho là khó (vì đối với một trò chơi nhất định, nó có thể hoặc không). Thay vào đó, chúng tôi cho phép bất kỳ chiến lược nào được đặt ở trạng thái cân bằng nếu khó có người chơi nào tính được độ lệch lợi nhuận. (Lưu ý điều này giả định không gian chiến lược theo cấp số nhân, nếu không chúng ta có thể kiểm tra tất cả các sai lệch.)
usul 10/12/14

Câu trả lời:


1

Tôi không thể nghĩ ra bất kỳ cách nào có thể có một câu trả lời dễ dàng, hoàn toàn tao nhã / thỏa mãn cho câu hỏi này, đặc biệt là vì phần thưởng kết thúc rất khó tính toán; tuy nhiên, suy nghĩ của tôi quá dài để đăng bình luận.

Ý tưởng tốt nhất tôi có là: Trong trường hợp cờ vua, hãy thử xấp xỉ xác suất Trắng sẽ thắng dựa trên lợi thế vật chất của Trắng (ví dụ: cầm đồ thêm, hiệp sĩ, v.v.) cho một vị trí nhất định bằng cách chọn ngẫu nhiên các vị trí với số tiền chính xác đó cấu hình vật liệu. Có lẽ trong trường hợp "cờ vua toàn năng", chúng ta có thể nói, "Trắng có khả năng chiến thắng như thế nào với 8 tân binh cho 17 tân binh của Đen?" Có lẽ xác suất này là 4%; để tính toán, chúng ta sẽ phải kiểm tra (giả sử) 1000 vị trí cờ được tạo ngẫu nhiên khác nhau có 8 rook trắng và 17 rook đen, và sau đó nhìn về phía trước (giả sử) 10 di chuyển sâu trong mọi trường hợp và xem cấu hình vật liệu mới là gì . Sau đó, lấy tỷ lệ cược dự kiến ​​dựa trên cấu hình vật liệu ở cuối,

Tất nhiên, cần phải tìm cấu hình vật liệu cho mọi khả năng có liên quan ( M , N ) của tân binh M trắng đến N tân binh đen ... có lẽ bắt đầu từ cặp có thứ tự thấp nhất ( M = 1, N = 1) và hoạt động lên từ đó

Đối với vị trí ban đầu, đừng đi theo thống kê mà bạn nhận được (nghĩa là, nếu vị trí ban đầu có ( M = 6, N = 7), đừng cho rằng Trắng có 25% cơ hội chiến thắng vì đó là tỷ lệ thắng dự kiến ​​cho (6,7)); thay vào đó, vì bạn có thể chính xác hơn, hãy nhìn 10 bước sâu như bình thường chỉ với một vị trí này và tìm mọi vị trí kết thúc có thể. Sau đó, tìm đường dẫn phù hợp (liên quan đến cách chơi tối ưu của cả hai bên) với cấu hình 10 bước di chuyển sâu và chọn tỷ lệ cược dự kiến ​​của đường dẫn này làm tỷ lệ cược dự kiến ​​của vị trí ban đầu.

Tôi nghĩ rằng quá trình này có thể được thực hiện trong thời gian đa thức. Nhìn k di chuyển sâu cho k cố định trong cờ vua là đa thức về kích thước của ván, và tổng số rooks trắng và đen được thể hiện bằng unary (theo nghĩa nào đó) bởi vì số đó phải nhỏ hơn kích thước của ván.

Nếu điều này nghe có vẻ phức tạp và khó giải thích, thì đó là vì nó là. Một bản tóm tắt ngắn gọn hơn về những gì tôi mô tả là: Sử dụng đệ quy và số liệu thống kê cơ bản để tính tỷ lệ chiến thắng cho các tân binh M trắng và N tân binh đen trên bảng. Sau đó sử dụng các giá trị này để xem k di chuyển sâu và xác định tỷ lệ cược mà Trắng sẽ giành được ở vị trí ban đầu.

Nhận xét cuối cùng: Tôi nghĩ vấn đề này cũng thú vị đối với các trò chơi không hoàn thành EXPTIME, chẳng hạn như tic-tac-toe, mà theo Wikipedia là PSPACE-Complete. Hơn nữa, tôi tin rằng một quá trình như quy trình mà tôi đã mô tả ở trên cũng có thể hữu ích ở đó, mặc dù rõ ràng là không thể có lợi thế "vật chất" trong tic-tac-toe; sẽ phải có một số cơ sở khác để đánh giá sự vượt trội của vị trí của X hoặc O.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.