Ostern, cân bằng Nash và tính đúng đắn của niềm tin


12

Trong phần Giới thiệu về Lý thuyết trò chơi, trạng thái cân bằng Nash được mô tả như sau (trang 21 .22):

Đầu tiên, mỗi người chơi chọn hành động của mình theo mô hình lựa chọn hợp lý, cho niềm tin của cô về hành động của người chơi khác. Thứ hai, niềm tin của mọi người chơi về hành động của người chơi khác là chính xác.

Dường như với tôi, định nghĩa này không hoàn toàn tương đương với định nghĩa thông thường về trạng thái cân bằng Nash như một hồ sơ chiến lược trong đó chiến lược của mỗi người chơi là phản ứng tốt nhất với chiến lược của những người khác.

Định nghĩa thông thường không nói gì về niềm tin và do đó cho phép khả năng niềm tin có thể không chính xác.

Để có một khả năng tầm thường, hãy xem xét tiến thoái lưỡng nan của tù nhân. Giả sử mỗi người chơi tin rằng người chơi khác sẽ không thú nhận. Vì thú nhận là một chiến lược vượt trội, mỗi người chơi vẫn sẽ thú nhận. Vì vậy, các hành động tạo thành trạng thái cân bằng Nash mặc dù niềm tin của người chơi hoàn toàn trái ngược với các hành động cân bằng thực tế.

Tôi có đúng theo cách hiểu này rằng định nghĩa của Ostern đặc trưng cho một cái gì đó khác với trạng thái cân bằng của Nash không?


Không "Định nghĩa thông thường không nói gì về niềm tin và do đó cho phép khả năng niềm tin có thể không chính xác." Đơn giản chỉ cần xoay quanh thực tế là bạn luôn có một giả định hợp lý cơ bản trong các định nghĩa này?
Thorst

Câu trả lời:


9

Giới thiệu ngôn ngữ của niềm tin ở đây hơi lạ, vì niềm tin đó có một ý nghĩa rất cụ thể trong các phần khác của lý thuyết trò chơi.

Thật vậy, mô tả của Ostern gợi nhớ đến trạng thái cân bằng Bayes Nash. Chúng ta có thể đưa khái niệm niềm tin vào dạng thông thường của một trò chơi thông tin hoàn chỉnh như sau: giả sử rằng với xác suất mỗi người chơi, tôi , là một "chiến lược"aii loại người sẽ chơi theo trạng thái cân bằng (Nash), và với xác suất anh ta sẽ chọn một số chiến lược thống nhất một cách ngẫu nhiên (bởi vì, giả sử, anh ta thờ ơ với tất cả các hành động). Do đó, chúng tôi có một trò chơi Bayes nơi suy nghĩ về niềm tin là tự nhiên hơn.1ai

Các giải pháp khái niệm Bayes Nash sau đó nói rằng 's chiến lược phải được tối ưu cho vở kịch dự kiến gây ra bởi các cầu thủ khác' chiến lược niềm tin đối với các loại của họ ngụ ý bởi { một j } j i . Nếu chúng ta nhìn vào giới hạn như một i1 cho tất cả i thì trạng thái cân bằng Bayes Nash của trò chơi này sẽ trùng với khái niệm giải pháp được mô tả bởi Osborne.i{aj}jiai1i


Tôi đoán lý do Ostern viết nó như thế này là một lý do sư phạm, cho rằng đây là một văn bản giới thiệu. Khi chúng tôi giới thiệu cho sinh viên về các trò chơi tĩnh, chúng tôi nói với họ rằng người chơi phản ứng tốt nhất với hành động của những người chơi khác. Sinh viên tự nhiên muốn biết "làm thế nào họ có thể phản ứng với một chiến lược được chọn đồng thời mà không biết chiến lược đó sẽ là gì?" Đây là, trong nhiều ý nghĩa, một câu hỏi triết học. Câu trả lời phổ biến lài

  • Nếu trò chơi là một trò chơi thường được chơi sau đó (đặt các vấn đề về kết quả khác có thể được duy trì trong các trò chơi lặp đi lặp lại), chúng ta có thể nghĩ Nash là một trạng thái cân bằng theo nghĩa là nếu chúng ta hội tụ ở đó, chúng ta có thể phát triển một quy tắc theo đó mọi người tiếp tục để chơi trạng thái cân bằng đó vô thời hạn (và mong đợi những người khác cũng làm như vậy).
  • Nếu trò chơi thực sự là một phát thì chúng ta thường đưa ra ý tưởng rằng người chơi sẽ cố gắng dự đoán những gì người khác sẽ làm và điều quan niệm cân bằng của chúng ta đưa ra ý tưởng rằng những dự đoán này phải chính xác.

Có vẻ như những dự đoán ở điểm thứ hai tương ứng với "niềm tin" được Ostern viện dẫn. Tuy nhiên, điều quan trọng là phải nhấn mạnh rằng những dự đoán / "niềm tin" này, chỉ là một công cụ không chính thức / trực quan để giúp chúng ta khái niệm những gì đang diễn ra ở trạng thái cân bằng và không phải là một phần của định nghĩa về trạng thái cân bằng như vậy. Bản thân khái niệm cân bằng Nash hoàn toàn không tin vào khái niệm niềm tin (như bạn lưu ý trong một nhận xét, nó chỉ được định nghĩa qua các hành động), đó là lý do tại sao, khi Ostern tiếp tục chính thức xác định xác cân bằng Nash, anh ta làm như vậy mà không cần gọi ý tưởng về niềm tin nào cả.


4

Giới thiệu niềm tin làm cho khái niệm về NE có thể so sánh với các khái niệm sàng lọc khác như PBE và trạng thái cân bằng tuần tự, nhưng ý nghĩa của NE không thay đổi.

Sách giáo khoa vi mô tốt nghiệp của Mas-Colell, Whinston và Green (MWG) có kết quả cho việc này

Mệnh đề 9.C.1. hình chiến lược là trạng thái cân bằng Nash của một trò chơi dạng rộng rãi Γ E nếu và chỉ khi tồn tại một hệ thống niềm tin μ sao choσΓEμ

  1. Hồ sơ cá nhân chiến lược là cách tuần tự hợp lý cho hệ thống niềm tin μ ở tất cả các bộ thông tin HPr ( H | σ ) > 0 .σμ HPr(H|σ)>0
  2. Hệ thống tín ngưỡng có nguồn gốc từ chiến lược hồ sơ σ thông qua quy tắc Bayes' bất cứ khi nào có thể.μσ

Do đó, ví dụ tiến thoái lưỡng nan của tù nhân mà bạn đưa ra khi người chơi có niềm tin trái ngược với những gì chiến lược thực tế của đối thủ không đạt được điều kiện thứ hai, điều này đòi hỏi niềm tin phải xuất phát từ quy tắc của Bayes bất cứ khi nào có thể. Trên thực tế, đây là tương đương toán học với yêu cầu thứ hai trong định nghĩa của Ostern: rằng niềm tin của người chơi về hành động của người chơi khác là chính xác.


Tôi nghĩ rằng có một sự khác biệt giữa MWG và Ostern. MWG đang nói rằng đối với trạng thái cân bằng Nash "tồn tại" một hệ thống niềm tin khiến nó trở nên hợp lý. Chúng tôi im lặng về những niềm tin, nếu có, người chơi thực sự có. Ostern đang nói rằng các cầu thủ thực sự có niềm tin và họ là những người đúng. Tôi nghĩ rằng cái sau thay đổi ý nghĩa khái niệm của ĐB vì định nghĩa thông thường hoàn toàn không đề cập đến niềm tin và ví dụ Tiến thoái lưỡng nan của tù nhân cho thấy rằng các chiến lược không xác định duy nhất niềm tin.
Jyotirmoy Bhattacharya

@JyotirmoyBhattacharya: Tôi không nghĩ MWG "im lặng về niềm tin, nếu có, người chơi thực sự có". Điều kiện 2 của đề xuất thực sự đòi hỏi niềm tin này phải xuất phát từ hồ sơ chiến lược cân bằng sử dụng quy tắc của Bayes bất cứ khi nào có thể. Do đó, trong ví dụ PD, khi một người chơi chọn khiếm khuyết với xác suất 1, niềm tin của người chơi khác cũng phải đặt xác suất 1 vào khiếm khuyết hành động và phản hồi tốt nhất với niềm tin đó (dẫn đến anh ta cũng chọn khuyết điểm).
Herr K.

@JyotirmoyBhattacharya: Tuy nhiên, niềm tin cho NE không cần phải là duy nhất. Điều này là do nếu ở trạng thái cân bằng nhất định, một đường dẫn trên cây trò chơi được thực hiện với xác suất bằng 0, thì quy tắc của Bayes không được áp dụng, và vì vậy mọi niềm tin vào con đường đó sẽ được coi là "chính xác" trong ĐB. Đây cũng là lý do tại sao các sàng lọc như trạng thái cân bằng tuần tự được đưa ra, để loại trừ niềm tin không hợp lý ra khỏi các đường cân bằng.
Herr K.

@JyotirmoyBhattacharya: Ngoài ra, vì là sách giáo khoa chưa tốt nghiệp, Ostern có thể đã chọn một ngôn ngữ trực quan hơn là nghiêm ngặt về mặt toán học vì lý do sư phạm. Đối với tôi, hai điều kiện trong định nghĩa của Ostern là đối trọng chính xác trong đề xuất của MWG.
Herr K.

3

Ví dụ tiến thoái lưỡng nan của tù nhân của bạn chỉ hoạt động vì đó là một trò chơi với các chiến lược vượt trội. Ostern là chính xác.

Để phản ứng tốt nhất với chiến lược của người chơi khác, như trong định nghĩa bạn đưa ra, tôi phải biết chiến lược của họ. Nói cách khác, tôi phải có niềm tin về những gì họ đang làm, và những niềm tin đó phải chính xác. Đây là một sự củng cố của khái niệm hợp lý.

(σ,μ1)(σ,μ2)μ2σΣσiBi(σi)... "Tôi tin rằng điều này có nghĩa là việc xác định niềm tin là không cần thiết, bởi vì niềm tin chính xác là một đánh giá chính xác về hồ sơ chiến lược. Tham khảo, một trong những cuốn sách của tôi, nó đưa ra định nghĩa thông thường với trích dẫn Nash (1950), và sau đó tiếp tục thảo luận về hai giả định cơ bản. Một là niềm tin đúng và thứ hai là chơi hợp lý với những niềm tin đúng đắn đó.


Nhưng để từ chối một cái gì đó một Countrexample là đủ. Nếu bạn coi Ostern như tuyên bố rằng định nghĩa của anh ta tương đương với Nash thì làm thế nào một người đối phó với ví dụ lưỡng nan của tù nhân. Tôi hiểu rằng định nghĩa của Ostern là tăng cường tính hợp lý, tôi trình bày rằng đó không phải là trạng thái cân bằng Nash vì lý do đơn giản là ở đây trạng thái cân bằng được định nghĩa trên hành động và niềm tin trong khi trạng thái cân bằng hoàn toàn im lặng về niềm tin.
Jyotirmoy Bhattacharya

1
Đó là một định nghĩa, không phải là một bằng chứng.
Pburg

Đủ công bằng. Nhưng đó là một định nghĩa về một khái niệm đã có một định nghĩa được chấp nhận tốt. Vì vậy, tôi hy vọng rằng nếu tác giả không đề cập đến nếu không thì ông cho rằng hai định nghĩa là tương đương.
Jyotirmoy Bhattacharya

để rõ ràng, anh ta có bao gồm những ý kiến ​​trong định nghĩa, hoặc trong các cuộc thảo luận? ps Tôi đã chỉnh sửa câu trả lời của mình
Pburg

Phần tôi trích dẫn là thảo luận. Ngay sau đó, ông nói (tr.22) "Hai thành phần này được thể hiện trong định nghĩa sau" và sau đó đưa ra định nghĩa tiêu chuẩn về mặt đáp ứng tốt nhất cho các chiến lược không đề cập đến niềm tin. Vậy đâu là niềm tin thể hiện trong định nghĩa? Và vấn đề không chỉ nằm ở những game có chiến lược vượt trội. Hoàn toàn có thể xây dựng các ví dụ khi không có chiến lược chi phối nhưng chiến lược cân bằng Nash là phản ứng tốt nhất cho niềm tin khác với chơi cân bằng.
Jyotirmoy Bhattacharya

2

Tôi có thể đang lặp lại những điều đã được nói trước đây, nhưng đây là tôi đảm nhận việc này.

Tôi nghĩ rằng chúng ta phải đối mặt với một vấn đề thông thường khi so sánh hai mô hình khác nhau. Điều "tương đương" có nghĩa là không hoàn toàn rõ ràng bởi vì hai định nghĩa nằm trong các thế giới khác nhau hoặc các mô hình khác nhau. Tuy nhiên, nếu "tương đương" được định nghĩa đúng, tôi nghĩ người ta có thể hiểu định nghĩa của Ostern và cho thấy rằng nó thực sự "tương đương" với NE.

Khái niệm giải pháp nằm dưới phần trích dẫn sẽ giống như sau:

S*b*Tôi

bạnTôi(STôi* | S-Tôi= =bTôi*)bạnTôi(S' | S-Tôi= =bTôi*) cho tất cả S'STôi
bTôi*= =S-Tôi*

BE" có thể có nghĩa là?

NE

p ), thì đó phải là một NE. Người ta có thể kiểm tra xem đây là trường hợp.

ĐƯỢC

Đây là phần khó khăn. Điều đó có nghĩa là "Mỗi NE là một BE"? Chắc chắn không phải là "một NE cộng với bất kỳ hồ sơ niềm tin nào là BE", như OP đã thể hiện với ví dụ phản biện của mình. Tuy nhiên, đó là trường hợp "bất kỳ NE nào cũng có thể trở thành BE cho một số hồ sơ niềm tin ". Tôi nghĩ rằng theo nghĩa này, người ta nên hiểu yêu cầu "tương đương" của Ostern

Lưu ý rằng chúng tôi cũng có tuyên bố "tương tự như" sau đây: " Kết quả của trò chơi là kết quả ĐB nếu và chỉ khi đó là kết quả BE".


Nhưng mọi BE không phải là NE vì khái niệm BE là sự suy yếu về tính hợp lý mà chúng ta hoàn toàn yếu hơn NE.
Jyotirmoy Bhattacharya

Như tôi đã viết, tôi gặp khó khăn trong việc hiểu ý nghĩa của một BE "không phải là" bởi vì họ dường như sống trong các mô hình khác nhau. Bạn có nghĩa là một số chiến lược được chơi tại BE không phải là NE? Tôi nghĩ rằng điều đó là không chính xác, nhưng tôi có thể đã bỏ lỡ một cái gì đó. Nếu đó là những gì bạn muốn nói, bạn có thể chỉ cho tôi một ví dụ ngược lại không? Điều đó sẽ rất hữu ích.
Martin Van der Linden

Tôi không chắc chắn rằng BE là một sự suy yếu của tính hợp lý. Theo hiểu biết của tôi, BE là tính hợp lý cùng với điều kiện phỏng đoán là chính xác, phải không? Nếu điều đó là chính xác, thì chúng ta sẽ không mạnh hơn tính hợp lý chứ? (tất nhiên có thể phụ thuộc vào khái niệm giải pháp "yếu hơn / mạnh hơn")
Martin Van der Linden
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.