Các thuật toán cho tính toán cân bằng Nash.


10

Tôi đã tìm kiếm trên diễn đàn để xem điều này đã được hỏi trước đó chưa, và trong khi lý thuyết trò chơi thuật toán được thảo luận, tôi không thể tìm thấy vấn đề đặc biệt này. Tôi đang cố gắng tìm ra thuật toán nổi tiếng nhất là gì để tính toán cân bằng Nash (chiến lược hỗn hợp) trong một trò chơi n-person hữu hạn. Tất nhiên, thuật toán này sẽ là PPAD. Tôi quan tâm đến tốc độ / hiệu quả hơn là độ chính xác hoàn hảo của thuật toán.

Cảm ơn, Philip


Chúng tôi có thể giúp bạn tốt hơn nếu bạn cung cấp thêm chi tiết. Ví dụ giá trị của bạn có trong tâm trí? Bạn có bất kỳ cấu trúc đặc biệt của chức năng hoàn trả trong tâm trí? Bạn có thực sự cần một trạng thái cân bằng Nash hay một trạng thái cân bằng tương quan là đủ? Bạn đang tìm kiếm một cái gì đó với giới hạn có thể chứng minh tốt hoặc một cái gì đó với hiệu suất thực tế tốt? n
Warren Schudy

Câu trả lời:


7

Câu trả lời ngắn gọn là mặc dù có một số thuật toán thời gian đa thức để tìm thấy các cân bằng Nash gần đúng, nhưng tất cả chúng đều tìm thấy các xấp xỉ tương đối kém - có lẽ không đủ tốt nếu bạn thực sự đang cố gắng tìm một thuật toán để chơi trò chơi. Người ta biết nhiều hơn về các trò chơi 2 người chơi so với các trò chơi n người chơi.

Nếu những gì bạn đang cố gắng thực sự tìm thấy trạng thái cân bằng Nash (gần đúng), thì một điều dễ mã hóa mà bạn có thể thử là mô phỏng chơi trò chơi, với mỗi người chơi sử dụng thuật toán đa số có trọng số ngẫu nhiên (http://en.wikipedia.org/ wiki / Randomized_ weighted_majority_alacticm). Điều này không được đảm bảo để hoạt động, nhưng trong nhiều trường hợp sẽ (Và được đảm bảo trong một số loại trò chơi nhất định, như trò chơi có tổng bằng 0). Đặc biệt, nếu quá trình này hội tụ hoàn toàn, nó được đảm bảo hội tụ đến trạng thái cân bằng Nash. Điều nguy hiểm là nó sẽ không hội tụ và quay vòng mãi mãi - nhưng ngay cả trong trường hợp này, lịch sử thực nghiệm của trò chơi sẽ hội tụ đến tập hợp các cân bằng tương quan thô.


Tôi bắt đầu xem xét bài báo được đề cập trong câu trả lời ở trên. Tôi đã không hiểu tất cả về nó (hoặc phần lớn trong cái nhìn đầu tiên) ... bạn có thể giải thích tại sao phép tính gần đúng là "tương đối kém?" Ngoài ra, bạn có thể giải thích ngắn gọn "cân bằng tương quan thô" là gì không? Tôi biết trạng thái cân bằng tương quan là gì, nhưng ý nghĩa của nó đối với một eq như vậy. để được thô Cuối cùng, ý của bạn là "lịch sử thực nghiệm của trò chơi sẽ hội tụ ... [vv.]"? Làm thế nào một cái gì đó không bao giờ hội tụ hội tụ vào một bộ CCE? Cảm ơn câu trả lời của bạn, tôi đang tìm kiếm bài viết Wikipedia ngay bây giờ.
Philip White

Đối với một số nền tảng về các thuật toán tạo ra các bản phân phối hội tụ đến cân bằng tương quan thô hoặc cân bằng tương quan, tôi sẽ bắt đầu tại đây: cs.cmu.edu/~avrim/Papers/regret-ch CHƯƠNG.pdf
Aaron Roth

Nếu bạn muốn một cân bằng tương quan chứ không phải là cân bằng tương quan thô, bạn có thể sử dụng một người học không hối tiếc nội bộ. Ví dụ (không biết xấu hổ cắm) cs.brown.edu/~ws/papers/regret.pdf . Ngoài ra còn có các thuật toán để tính toán cân bằng tương quan trực tiếp trong thời gian đa thức.
Warren Schudy


4

Nếu bạn quan tâm đến các thuật toán được thực hiện trong phần mềm, có một số thuật toán mà tôi biết:

  1. gói GAMBIT (http://www.gambit-project.org/doc/index.html) thực hiện một số thuật toán cân bằng Nash cho dạng thông thường 2 người chơi và n-player và trong một số trường hợp, trò chơi dạng rộng.

  2. GameTracer (http://dags.stanford.edu/Games/gametracer.html) triển khai thuật toán GNM và IPA của Govindan & Wilson cho các trò chơi dạng thông thường của người chơi n.

  3. Đối với các trò chơi lớn, biểu diễn dạng bình thường có vấn đề khi kích thước tăng theo cấp số nhân về số lượng người chơi. Thay vào đó, nếu chức năng tiện ích của trò chơi của bạn có một số loại cấu trúc nhất định, bạn có thể sử dụng "biểu diễn ngắn gọn" (ví dụ: trò chơi đồ họa, trò chơi đối xứng, trò chơi đồ thị hành động) để thể hiện nó bằng cách sử dụng ít không gian hơn; và hơn nữa cấu trúc thường có thể được khai thác để tăng tốc tính toán. Về phần mềm, Bộ giải AGG (http://agg.cs.ubc.ca) điều chỉnh thuật toán GNM của GameTracer và thuật toán simpdiv của GAMBIT cho đại diện của trò chơi đồ thị hành động (AGG). (Tuyên bố miễn trừ trách nhiệm: Tôi tham gia vào việc phát triển phần mềm pacakge này.)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.