Battigalli thực sự có ý nghĩa gì bởi những người chơi không thể chọn chiến lược, họ chỉ có thể chọn hành động.


9

Trong video này (từ 7: 30 đến 9:00) trên Youtube, Battigalli đã đề cập đến tình trạng của thế giới đối với một trò chơi rết ba chân đơn giản, theo cách nói của anh ta là

" một mô tả về mọi vấn đề, trong lý thuyết truyền thống, phải bao gồm các chiến lược đặc trưng cho Ann và Bob. Tôi không sử dụng từ 'Ann chọn một chiến lược'. Lý do rất đơn giản. không phân loại chiến lược. Người chơi không thể chọn chiến lược, họ chỉ có thể chọn hành động. Nếu Ann có thể chọn chiến lược , họ đang chơi một trò chơi khác. "(C,C)

Pierpaolo Battigalli thực sự có ý nghĩa gì? Nếu các hành động cho người chơi chọn đã được chỉ định, thì nó sẽ tự động chỉ định một chiến lược thuần túy. Theo phương pháp này, anh ta dường như muốn phân biệt một cấu trúc trò chơi với sự cam kết và một trò chơi không có, nhưng làm thế nào?

Đã thêm: Đây là các slide được sử dụng trong video và đây là giấy tương ứng.

Câu trả lời:


9

Ý tưởng chính là người chơi không chọn hành động s , nhưng chỉ chọn một hành động vào thời điểm đó tại mỗi nút mà tại đó họ chơi, dựa trên niềm tin của họ về cách thức người chơi khác và chính họ sẽ chơi tại các nút tương lai trong game (nơi niềm tin là điều kiện trên lịch sử dẫn đến nút đó).

Giải thích là cho phép người chơi chọn các chiến lược đầy đủ tương đương với việc cho phép người chơi dựa vào một chương trình máy tính để chơi trò chơi ở vị trí của họ. Đó là, họ có thể cam kết thông qua chương trình máy tính này để chơi một hành động nhất định tại mỗi nút.

Các trò chơi như vậy với các thiết bị cam kết về bản chất rất khác với các trò chơi mà người chơi thực tế phải liên tục chọn một hành động tại mỗi nút quyết định của mình. Khi người chơi thực tế chơi tại các nút, người chơi phải hình thành niềm tin về cách người chơi khác và bản thân họ sẽ chơi tại các nút trong tương lai và những niềm tin này có thể phụ thuộc vào lịch sử dẫn đến các nút trong tương lai .

Chẳng hạn, trong trò chơi Stackelberg, nhà lãnh đạo có thể tin rằng người theo dõi sẽ hợp lý (nghĩa là tối đa hóa tiện ích) nếu nhà lãnh đạo chơi "Sản xuất thấp", nhưng sẽ không hợp lý (nghĩa là tối đa hóa tiện ích) nếu nhà lãnh đạo chơi "Cao sản xuất". Có thể nhà lãnh đạo dự đoán rằng người theo dõi sẽ tức giận nếu nhà lãnh đạo chơi "Sản xuất cao", và rằng, bị mù bởi sự tức giận của cô, người theo dõi sau đó muốn trả đũa.

Nếu người theo dõi có thể cam kết thông qua một chiến lược, trò chơi sẽ hoàn toàn khác. Có lẽ người theo dõi có thể đã cam kết không trả đũa trước khi cô ấy tức giận, và cô ấy không thể giúp cô ấy muốn trả đũa nữa. Nhưng ở đây, ý tưởng là người theo dõi thực tế phải chọn một hành động sau đó trong trò chơi dựa trên những gì người lãnh đạo đã chọn ở nút gốc. Do đó, quy tắc hành vi thông qua đó người theo dõi chọn một hành động tại một nút (ví dụ: max max so với không max max) và niềm tin của người lãnh đạo về các thủ tục này cũng có thể phụ thuộc vào lịch sử dẫn đến nút đó.

Điều này mở đường cho nhiều kết quả mới của trò chơi không xuất hiện từ lý thuyết trò chơi cổ điển. Từ quan điểm khái niệm, nó cũng chuyển trọng tâm từ khái niệm giải pháp sang giả định nhận thức và hành vi (nghĩa là từ lý thuyết trò chơi cổ điển sang lý thuyết trò chơi epistemia). Thay vì xác định một tập hợp các kết quả hợp lý (ví dụ: kết quả cân bằng Nash) và xem xét các chiến lược phù hợp với các kết quả này, người ta xác định các thuộc tính hợp lý của hành vi và niềm tin của người chơi (về niềm tin và hành vi của nhau) và đưa ra kết luận về những giả định nhận thức và hành vi cho kết quả khi trò chơi mở ra .

Bây giờ, điều này chỉ là để cung cấp một chút thịt và trực giác cho khuôn khổ của Battigalli, và nó không công bằng với sự phong phú của khung (một phần vì tôi không biết nhiều về công việc của anh ấy ngoài video mà bạn liên kết). Nếu bạn chưa làm điều đó, tôi thực sự khuyên bạn nên xem toàn bộ video. Tôi nghĩ Battigalli làm rất tốt trong việc làm cho khuôn khổ của anh ấy có thể truy cập được. Ông cũng đưa ra các ví dụ hữu ích và trực quan để kết nối cách tiếp cận sử thi của mình với lý thuyết trò chơi "cổ điển" bằng cách xác định các điều kiện đơn giản về niềm tin và hành vi của người chơi cho phép khôi phục các giải pháp cổ điển cho các trò chơi như cảm ứng ngược.


Cảm ơn rất nhiều cho câu trả lời của bạn, rất hữu ích. Dường như với tôi cách giải thích của bạn về nguyên tắc của Battigalli, tức là lựa chọn hành động, chứ không phải chiến lược, tương đương với hệ thống niềm tin năng động của anh ấy, niềm tin có điều kiện vào niềm tin có điều kiện hơn là niềm tin vào chiến lược, và dường như, bạn dường như đề cập đến kết quả của anh ấy, niềm tin năng động của anh ấy hệ thống và niềm tin mạnh mẽ vào tính hợp lý ngụ ý cảm ứng ngược, điều này hấp dẫn hơn kiến ​​thức phổ biến của Aumann về tính duy lý ngụ ý cảm ứng ngược.
Hòa bình thế giới Metta

Vấn đề là những điều này được phát triển bởi Battigalli và các đồng tác giả của ông hơn một thập kỷ trước. Nhưng bài giảng này là về công việc của anh ấy vào năm 2013. Công cụ mới là gì?
Hòa bình thế giới Metta

"Nếu bạn chưa làm điều đó, tôi thực sự khuyên bạn nên xem toàn bộ video." Cụm từ "khuyến nghị mạnh mẽ" tương tự như "tin tưởng mạnh mẽ" như được đặt ra bởi Battigalli, phải không? :)
Hòa bình thế giới Metta

@MettaWorldPeace: Tôi không biết về công việc của Battigall trước khi xem video, vì vậy tôi không thể biết liệu có điều gì mới trong đó hay liệu anh ấy chỉ giới thiệu về công việc mà anh ấy đã phát triển trong thập kỷ qua.
Martin Van der Linden
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.