Lý thuyết trò chơi thuật toán - khái niệm cân bằng phi tiêu chuẩn?


11

Tôi đang bắt đầu nghiên cứu về lý thuyết trò chơi thuật toán và dường như khái niệm cân bằng thường được sử dụng là một điểm cố định trong biểu đồ. Tuy nhiên, mọi người đã xem xét các khái niệm cân bằng thay thế, chẳng hạn như chu kỳ giới hạn? Tôi có thể tưởng tượng rằng một chu kỳ giới hạn "chặt chẽ" - nghĩa là một chu kỳ trong biểu đồ có độ dài rất nhỏ - có thể được coi là một cái gì đó "gần" với định nghĩa cân bằng tiêu chuẩn.

Tôi đã thử đào xung quanh Google Scholar, nhưng vô ích.

Câu trả lời:


10

Một cái mà tôi thích đôi khi được gọi là "Cân bằng tương quan thô". Đây thực sự là tập hợp giới hạn của động lực học "Không hối tiếc" hiệu quả.

Chúng có một số tính chất tốt, trong đó ít nhất là chúng có thể đạt được bằng động lực học được kết hợp, hiệu quả và bao gồm cân bằng Nash như một trường hợp đặc biệt (vì vậy `` hoàn toàn hợp lý '' như một dự đoán về hành vi). Điều có thể làm cho chúng hơi giống với những gì bạn đang hỏi, là những động lực học tập này không cần phải hội tụ đến một điểm cố định - thực sự, chúng có thể quay vòng mãi mãi. Tuy nhiên, người ta thường có thể ràng buộc sự hội tụ nhanh chóng của phúc lợi xã hội theo các động lực này (tức là giá của tình trạng hỗn loạn so với cân bằng tương quan thô), và hơn thế nữa, thường thì phúc lợi xã hội không tệ hơn so với cân bằng tương quan thô so với cân bằng Nash.

Một số giấy tờ liên quan:

http://portal.acm.org/cites.cfm?id=1374430

http://portal.acm.org/cites.cfm?id=1536414.1536485

http://portal.acm.org/cites.cfm?id=1536487


15

Bạn có thể đang tìm kiếm một cái gì đó giống như Equilibria chìm (bắt đầu từ ví dụ http://arxiv.org/abs/0902.0382 ) - nhưng độ dài chu kỳ không được xem xét.


À, đẹp quá. Thuật ngữ "cân bằng chìm" là những gì tôi đang tìm kiếm. Cảm ơn!
Henry Yuen

4

Đây có lẽ không phải là thứ bạn đang tìm kiếm, nhưng có thể xác định trạng thái cân bằng Nash gần đúng trong đó mục tiêu là tìm các trạng thái sao cho các tiện ích của người chơi gần với trạng thái cân bằng Nash được xác định. Noam Nisan có một bài viết hay về điều này (và đôi khi anh ta đi chơi ở đây, anh ta có thể sẽ có câu trả lời tốt hơn cho bạn).


4

Joseph Y. Halpern từ Cornell gần đây đã có buổi nói chuyện tại Trung tâm tốt nghiệp CUNY với tiêu đề: Beyond Nash Cân bằng: Các khái niệm giải pháp cho thế kỷ 21. Có lẽ công việc của anh ấy sẽ được bạn quan tâm.

http://web.cs.gc.cuny.edu/~kgb/seminar.html


Liên kết này dường như không hoạt động đối với tôi?
András Salamon

Một bài báo mà Halpern đã viết và có lẽ là nền tảng cho bài nói chuyện của anh ấy ở đây: cs.cornell.edu/home/halpern/abauge.html#beyond
Joseph Malkevitch

3

Hy vọng rằng điều này không quá lạc đề về một câu trả lời, vì nó xem xét câu hỏi này từ quan điểm của lý thuyết trò chơi tiến hóa (EGT), thay vì AGT.

Lý thuyết trò chơi như công thức ban đầu của von Neumann và Morgenstern là một lý thuyết tĩnh. Do đó, nhiều khái niệm cân bằng phổ biến (Nash, Correlated, v.v.) vốn đã tĩnh. Để nói về cân bằng không tĩnh, chúng tôi phải giới thiệu một số loại động lực. AGT thường làm điều này bằng cách xem xét các tác nhân lý luận cụ thể (thuật toán) có thể sử dụng để đi đến quyết định của họ.

Một cách tiếp cận khác, và được EGT chấp nhận, là xem xét động lực dân số của một số lượng lớn các tác nhân với việc ra quyết định rất đơn giản. Điều này thường tạo ra động lực phi tuyến tính trong dân số và đặt EGT là một phần của hệ thống động. Do đó, bạn bắt đầu thấy tất cả các khái niệm cân bằng điên rồ của các hệ thống động như chu kỳ giới hạn hoặc các công cụ thu hút hỗn loạn bật lên như các khái niệm cân bằng. Các cân bằng không cố định này được nghiên cứu kỹ trong EGT, mặc dù thường phân tích hoàn toàn từ các hệ thống động và không phải là thuật toán.

Nếu bạn đang quan tâm đến EGT, sau đó một điểm chuẩn (và dễ tiếp cận) bắt đầu là Hofbauer và Sigmund của cuộc khảo sát 2003 " động trò chơi tiến hóa "

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.