Khi nào các chiến lược cân bằng


9

Nash Equilibria nói chung là không thể tính toán được. Một -Nash trạng thái cân bằng là một tập hợp các chiến lược ở đâu, cho chiến lược của đối thủ, mỗi người chơi có được trong vòng của phần thưởng dự kiến tối đa có thể. Tìm một trạng thái cân bằng -Nash, được cho và một trò chơi, là .ε ε ε P P A DϵϵϵϵPPAD

Theo đúng các định nghĩa, dường như không có lý do cụ thể nào để tin rằng các chiến lược của trạng thái cân bằng -Nash nhất định là bất kỳ nơi nào gần với chiến lược của bất kỳ trạng thái cân bằng Nash nào. Tuy nhiên, chúng ta thường thấy các tài liệu hơi sử dụng một cụm từ như "tính toán cân bằng Nash" khi nó có nghĩa là "tính toán cân bằng Nash gần đúng".ϵ

Vì vậy, tôi tự hỏi khi thứ hai ngụ ý thứ nhất; nghĩa là, đối với những trò chơi nào chúng ta có thể mong đợi -Nash cân bằng sẽ "gần" với cân bằng Nash?ϵ


Chính thức hơn, giả sử tôi có một trò chơi trên người chơi và một chuỗi các hồ sơ chiến lược .( s ( 1 ) 1 , ... , s ( 1 ) n ) , ( s ( 2 ) 1 , ... , s ( 2 ) n ) , ( s ( 3 ) 1 , ... , s ( 3 ) n ) , ...n(s1(1),,sn(1)),(s1(2),,sn(2)),(s1(3),,sn(3)),

Mỗi là một cân bằng -Nash và chuỗi hội tụ về không.ε i ε 1 , ε 2 , ε 3 , ...(s1(i),,sn(i))ϵiϵ1,ϵ2,ϵ3,

Những câu hỏi của tôi:

  1. Khi nào (trong những điều kiện / giả định) làm tất cả các chiến lược hội tụ? Đó là, đối với mỗi người chơi , s ( 1 ) j , s ( 2 ) j , s ( 3 ) j , ... nhất thiết phải hội tụ.jsj(1),sj(2),sj(3),

  2. Trong những điều kiện xa hơn là giới hạn của chuỗi này thực sự là điểm cân bằng Nash của trò chơi? (Dường như với tôi rằng không cần phải có thêm giả định nào nữa; tức là , nếu tất cả các chiến lược đều hội tụ, giới hạn phải là một NE.)

  3. Khi nào thì một thuật toán để tính toán -Nash cân bằng nhất thiết phải ngụ ý một thuật toán cho các chiến lược tính toán xấp xỉ của cân bằng Nash? Các điều kiện trên có đủ không?ϵ

Cảm ơn rất nhiều!


Chỉnh sửa 2014/03/19

Sau khi đọc tài liệu tham khảo trong câu trả lời của Rahul, có vẻ hợp lý hơn khi nghĩ về khoảng cách giữa các bản phân phối thay vì các chuỗi hội tụ. Vì vậy, tôi sẽ cố gắng viết lại các câu hỏi và cũng đặt một số suy nghĩ gần đây.1

  1. (Vâng, đây là quá thuật toán phụ thuộc để thực sự có một câu trả lời. Nếu không có hạn chế đối với các thuật toán, bạn có thể có hai điểm cân bằng Nash khác biệt và sau đó, khi bạn cắm vào nhỏ hơn và nhỏ hơn vào các thuật toán, các 1 khoảng cách giữa đầu ra liên tiếp vẫn có thể lớn vì các đầu ra dao động giữa các điểm cân bằng.)ϵ1

  2. ppϵq delta 0 ε 0 1pq1δqδ0ϵ01

    Điều này thực sự khó khăn bởi vì chúng tôi trong cài đặt phức tạp mà chúng tôi gọi là "trò chơi" thực sự là một chuỗi các trò chơi được tham số hóa bởi , số lượng chiến lược thuần túy ("hành động"). Vì vậy, là và tỷ lệ tương đối quan trọng. Dưới đây là một ví dụ đơn giản để hiển thị câu trả lời không phải là "tất cả các trò chơi". Giả sử chúng tôi sửa một chuỗi giảm . Sau đó, với mỗi , hãy xây dựng trò chơi hai người chơi trên hành động trong đó, nếu một người chơi thực hiện hành động đầu tiên, họ sẽ nhận được số tiền thưởng là bất kể người chơi khác chơi gì; nếu người chơi chơi hành động thứ hai, họ sẽ nhận được số tiền thưởng làn ε 0 ε 1 , ε 2 , ... ε n n 1 1 - ε n 0nnϵ0ϵ1,ϵ2,ϵnn11ϵnbất kể người chơi khác chơi gì; và nếu một người chơi chơi bất kỳ hành động nào khác, họ sẽ nhận được số tiền thưởng bằng bất kể người chơi khác chơi gì.0

    Do đó, mỗi trò chơi có -equilibrium (cả hai đều chơi hành động thứ hai) cách xa tối đa khoảng cách so với trạng thái cân bằng Nash duy nhất của nó (cả hai đều chơi hành động đầu tiên).nϵn1

    Vì vậy, hai câu hỏi phụ thú vị:

    1. Đối với một trò chơi cố định và cố định , cho dù "đủ nhỏ" thì điều kiện trên vẫn giữ (tất cả -equilibria đều gần với cân bằng Nash).nϵϵ
    2. Có lẽ về cơ bản cùng một câu hỏi, nhưng liệu điều kiện có giữ nếu sự khác biệt về số tiền chi trả được giới hạn bởi một hằng số là .n
  3. Câu hỏi tương tự như (2), nhưng liên quan đến cân bằng thực tế được tính toán bằng các thuật toán. Tôi đoán có lẽ chúng ta sẽ nhận được câu trả lời về thuật toán / xây dựng hoặc không có gì cả, vì vậy sự khác biệt không quan trọng lắm.


Luôn luôn có một điểm giới hạn mà một phụ chuỗi của epsilon-cân bằng tụ, và giới hạn này sẽ là một trạng thái cân bằng Nash chính xác. Điều này được ngụ ý bởi sự gọn nhẹ của không gian của các cấu hình chiến lược hỗn hợp và tính liên tục của các chức năng tiện ích như là một chức năng của xác suất chiến lược hỗn hợp. (s1...sn)
Noam

Câu trả lời:


5

Bài báo sau đây ít nhất chính thức hóa khái niệm cân bằng gần đúng với cân bằng chính xác và chứng minh một số kết quả cấu trúc liên quan.

Pranjal Awasthi, Maria-Florina Balcan, Avrim Blum, Hoặc Sheffet và Santosh Vempala (2010). Trên cân bằng Nash của các trò chơi ổn định gần đúng. Trong Kỷ yếu hội thảo quốc tế lần thứ ba về lý thuyết trò chơi thuật toán (SAGT'10), 78-89.

Cụ thể, bài báo đưa ra một ví dụ về một lớp trò chơi cho câu hỏi 3.


Cảm ơn! Tôi đoán đây là trạng thái của nghệ thuật. Tôi sẽ thêm một số suy nghĩ trong câu hỏi của tôi là tốt.
usul
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.