Niềm tin về con đường cân bằng với các chiến lược chồng chéo


2

Đây là một câu hỏi cơ bản, nhưng tôi không thể tìm thấy câu trả lời cho nó. Nói tóm lại, cân bằng thường được quy định trên một chiến lược cụ thể. Ví dụ: được đưa ra chiến lược của A, B cập nhật niềm tin của mình cho xyz. Vấn đề của tôi là thường một hành động có thể là một phần của con đường cân bằng cho nhiều chiến lược khác nhau, vậy làm thế nào để B biết chiến lược A đang theo?

Dưới đây là một ví dụ có thể làm rõ câu hỏi.

Hãy xem xét một trò chơi báo hiệu cổ điển (2 loại, 2 hành động) à la Spence. Giả sử thêm rằng có hai điểm cân bằng: một gộp, một tách. Trong nhóm tổng hợp, giả sử, cả hai loại người gửi đều gửi "Thấp". Trong phần tách biệt, loại "Mạnh" gửi Cao, loại Yếu gửi Thấp.

Phần mà tôi đấu tranh là: làm thế nào để người nhận biết họ đang đi theo con đường cân bằng nào? Ví dụ, giả sử người nhận quan sát "Thấp". Nếu chúng ta ở trong "thế giới chung", thì hậu thế của người nhận sẽ trở thành linh mục của cô ấy. Tuy nhiên, nếu chúng ta đang ở "thế giới tách biệt", thì cô ấy có thể cập nhật thành p (Yếu | Thấp) = 1. Nhưng chỉ quan sát "Thấp" không cho người nhận biết chiến lược mà người gửi đang theo dõi, vậy làm thế nào cô ấy có thể cập nhật niềm tin của mình? Dường như với tôi rằng cô ấy sẽ cần phải có niềm tin không chỉ về các loại, mà còn về các chiến lược được tuân theo.

Xin lỗi nếu điều này là ngu ngốc, nhưng điều này đã làm tôi bối rối trong một thời gian.


Bạn có thể nói rõ hơn về trò chơi mà bạn mô tả? Giống như xây dựng một ma trận tất cả các hành động và tiện ích có thể?
koita_pisw_sou

Câu trả lời:


2

Đây là một nguồn hiểu lầm phổ biến liên quan đến khái niệm cân bằng. Đặc điểm kỹ thuật của trạng thái cân bằng (ít nhất là trong lý thuyết tiêu chuẩn của trò chơi một phát) là không rõ ràng về cách người chơi tìm ra họ ở trạng thái cân bằng đó, và theo định nghĩa, giả định người chơi biết các chiến lược cũ của đối thủ của họ.

Chúng tôi không cần sự phức tạp của các trò chơi thông tin không đầy đủ để sự nhầm lẫn này phát sinh. Hãy nghĩ về một trò chơi phối hợp đồng thời: cả hai người chơi chơi đầu đều là NE, nhưng làm thế nào để người chơi 1 biết người chơi 2 sẽ chơi đầu, vì chơi đuôi cũng có thể là NE? Trong các trò chơi thông tin năng động và không đầy đủ, vấn đề này có thể trở nên trầm trọng hơn, nhưng vấn đề cốt lõi là như nhau: trạng thái cân bằng cho rằng người chơi phản ứng tốt nhất với chiến lược thực sự của người chơi khác và do đó họ biết tình trạng cân bằng nào đang xảy ra.

Làm thế nào để có ý nghĩa về điều này? Chà, đối với người mới bắt đầu, chúng ta có thể chấp nhận nó như cách mọi thứ hoạt động, giả sử rằng cân bằng phát sinh từ một quá trình học tập / tiến hóa, và một khi đã biết đến trạng thái cân bằng, sẽ không có người chơi nào muốn đi chệch hướng. Điều này có thể có ý nghĩa trong các trò chơi phối hợp đơn giản, nhưng không thỏa mãn trong ví dụ bạn đưa ra. Để khắc phục điều này, chúng ta có thể đưa ra các giả định về việc cân bằng nào sẽ xảy ra (nghĩa là tinh chỉnh bộ cân bằng), để trong trạng thái cân bằng còn tồn tại, niềm tin được xác định rõ ràng hơn. Có nhiều cách khác nhau để giải quyết vấn đề này, nhưng, một sàng lọc được phát triển để làm giảm bớt mối quan tâm của bạn, đặc biệt là Tiêu chí trực quan , loại bỏ eq. trong đó (sao chép một cách đáng xấu hổ từ wiki) "một số loại $ \ theta $, người có thể hưởng lợi từ sự sai lệch được đảm bảo mang lại cho anh ta một khoản chi trả cao hơn mức chi trả cân bằng của anh ta, miễn là những người chơi khác không xác định được xác suất dương bất kỳ loại $ \ theta '$ nào mà hành động này là trạng thái cân bằng chiếm ưu thế. " Lưu ý, điều này giúp loại bỏ các eq gộp. vì loại cao một mình có thể kiếm lợi nhuận bằng cách sai lệch đến $ high $, điều này sẽ báo hiệu cho Người nhận rằng trạng thái cân bằng riêng biệt đang diễn ra.

Cuối cùng, lựa chọn ít thực tế nhất nhưng có lẽ thỏa mãn nhất về mặt lý thuyết là từ bỏ trạng thái cân bằng cùng nhau và thừa nhận rằng từ quan điểm nhận thức hợp lý là dự đoán chặt chẽ nhất được ngụ ý bởi tính hợp lý :)


Tôi tin rằng bạn có nghĩa là một số loại trò chơi phối hợp chứ không phải là đồng xu phù hợp, không có trạng thái cân bằng thuần túy.
denesp

Tất nhiên! Ý tôi là cuộc chiến của hai giới.
201p

2
Bạn có thể muốn chỉnh sửa phần này của câu trả lời của bạn?
denesp

Cảm ơn bạn rất nhiều vì câu trả lời hữu ích nhất của bạn! Điều này khiến tôi đọc bài báo này của Fudenberg và Levine, mà tôi nghĩ rằng câu trả lời cho câu hỏi của tôi: Fudenberg, Drew và David K. Levine. Cân bằng tự khẳng định. Tiết kinh tế lượng, vol. 61, không 3, 1993, trang 523 từ545. JSTOR, www.jstor.org/urdy/2951716. Nói tóm lại, các cân bằng và tinh chỉnh Nash tiêu chuẩn thực sự cho rằng niềm tin của mỗi người chơi về lối chơi của đối thủ là chính xác và đây có thể là một vấn đề. Fudenberg và Levin giải quyết vấn đề này bằng cách nới lỏng giả định về niềm tin chính xác về chiến lược của người chơi khỏi con đường cân bằng.
Tom R

2

Trong các trò chơi báo hiệu, niềm tin cũng như các chiến lược tạo thành một trạng thái cân bằng. Nói cách khác, niềm tin là một phần của đối tượng cân bằng. Bằng cách quyết định cân bằng nào để tập trung vào, bạn cũng (một phần) xác định niềm tin phù hợp với trạng thái cân bằng đó. Hạn chế chính là niềm tin bắt nguồn từ quy tắc của Bayes bằng chiến lược của người gửi và trước đó.

Hãy xem xét trò chơi sau, trong đó P1 là người gửi và ưu tiên chung là Loại I nhận ra với xác suất $ p $.

Cân bằng tách

enter image description here

Ở trạng thái cân bằng riêng biệt, các loại khác nhau chọn các hành động khác nhau (Loại I chọn $ A $ và Loại II chọn $ B $). Sau đó, khi thấy hành động $ A $, P2 (người nhận) cập nhật niềm tin của cô ấy bằng cách sử dụng quy tắc của Bayes: $$ \ mu (\ text {Loại I} | A) = \ frac {\ Pr (A | \ text {Loại I}) p} {\ Pr (A | \ text {Loại I}) p + \ Pr (A | \ văn bản {Loại II}) (1-p)} = \ frac {(1) p} {(1) p + (0) (1-p)} = 1 $$ Do đó, niềm tin có điều kiện của P2 tại nút $ x $ là $ 1 $. Tương tự như vậy đối với niềm tin của cô ấy vào thông tin được đặt $ \ {x ', y' \} $

Cân bằng tổng hợp

enter image description here

Bây giờ, hãy xem xét trạng thái cân bằng gộp, trong đó cả hai loại đều chọn $ A $. Sau đó, khi thấy hành động $ A $, niềm tin của P2 được tính là $$ \ mu (\ text {Loại I} | A) = \ frac {\ Pr (A | \ text {Loại I}) p} {\ Pr (A | \ text {Loại I}) p + \ Pr (A | \ văn bản {Loại II}) (1-p)} = \ frac {(1) p} {(1) p + (1) (1-p)} = p $$ đó là giống như trước đây của cô. Điều này có ý nghĩa bởi vì hành động của P1 không cung cấp thêm thông tin nào trong trạng thái cân bằng gộp. (Niềm tin cân bằng của P2 có thể tùy ý, trừ khi bạn muốn áp dụng các sàng lọc như tính nhất quán của trạng thái cân bằng tuần tự).


Điểm mấu chốt là: bạn không thể nói về trạng thái cân bằng tách biệt với niềm tin. Bằng cách nói về một trạng thái cân bằng cụ thể, bạn cũng ngầm hạn chế tập hợp niềm tin phù hợp với trạng thái cân bằng đã nói.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.