Cân bằng Bayes hoàn hảo


8

Tôi đã được đưa ra một câu hỏi mà tôi đang đấu tranh với:

Hãy chơi trò chơi Dilemma tiêu chuẩn của tù nhân và xem xét nó được chơi hai lần. (Người chơi quan sát kết quả của trò chơi đầu tiên trước khi chơi lần thứ hai). Hãy xem xét niềm tin về mặt mà trình phát nút 2 trong tập thông tin của họ.

Tìm một điểm cân bằng bayes hoàn hảo yếu (chiến lược và niềm tin) trong đó các chiến lược không phải là trạng thái cân bằng hoàn hảo của trò chơi phụ.

Vì vậy, trong tình trạng tiến thoái lưỡng nan của tù nhân:

(Defect, Defect) là nash độc đáo và do đó cũng là trạng thái cân bằng hoàn hảo của trò chơi phụ duy nhất.

Nhưng làm thế nào chúng ta có thể có được trạng thái cân bằng bayes hoàn hảo yếu không liên quan đến Khiếm khuyết? Chắc chắn điều này là hoàn toàn chi phối. . .

Là câu hỏi sai?

Sau đó, tiếp tục yêu cầu cân bằng tuần tự (nơi chúng tôi xem xét chuỗi các chiến lược hỗn hợp).

Là câu hỏi này sai hay tôi hiểu sai những khái niệm này?


Đó không phải là trả lời câu hỏi mà chỉ cung cấp một điểm phạm vi. . . Trong thực tế, chiến lược phải bao gồm 5 yếu tố.
Brian

Đưa ra nhận xét của bạn Bây giờ tôi nghĩ rằng vấn đề của bạn nằm ở chỗ khác: Nếu bạn chọn một chiến lược thống trị trong một trò chơi phụ nằm ngoài con đường cân bằng (vì vậy một điều không thực sự xảy ra) tiền chi trả của bạn sẽ không giảm.
Giskard

Vì vậy, tôi hiểu rằng niềm tin về con đường không cân bằng có thể là tùy tiện (và do đó không phải theo cập nhật của Bayes) nhưng tôi có ấn tượng rằng tính hợp lý tuần tự phải giữ (ví dụ như những niềm tin đó, cá nhân phải được chơi chiến lược tốt nhất của họ). Vì vậy, để đáp lại đề xuất của bạn, một chiến lược thống trị có vi phạm tính hợp lý tuần tự không?
Brian

3
@denesp: PBE yếu là "yếu" không phải vì nó không đòi hỏi sự hợp lý tuần tự khỏi đường cân bằng, mà bởi vì nó không đòi hỏi niềm tin phải phù hợp với quy tắc Bayes khỏi đường cân bằng. Mặc dù tôi đồng ý rằng trong trường hợp hai lần tiến thoái lưỡng nan của tù nhân (PD), không có WPBE với các chiến lược hoàn hảo không phải là phụ bản, kết luận này không nói chung. Lý do là bởi vì khiếm khuyết là một chiến lược chi phối nghiêm ngặt trong PD, do đó, đối với bất kỳ niềm tin nào ngoài con đường cân bằng (ngay cả khi không phù hợp với quy tắc của Bayes), khiếm khuyết vẫn là tuần tự hợp lý.
Herr K.

1
Tuy nhiên, đối với các trò chơi không có chiến lược chi phối, chúng ta có thể điều khiển niềm tin cân bằng theo cách để biến các chiến lược hoàn hảo không phụ thuộc thành hợp lý theo trình tự. Nếu chúng ta củng cố yêu cầu về tính nhất quán đối với niềm tin (như được yêu cầu trong trạng thái cân bằng tuần tự) bằng cách buộc quy tắc Bayes giữ vững trạng thái cân bằng, thì chúng ta có thể loại trừ các chiến lược hoàn hảo không phụ thuộc. Do đó, chúng ta có kết quả là trạng thái cân bằng tuần tự ngụ ý cả WPBE và SPE.
Herr K.

Câu trả lời:


2

Hãy để chiến lược của người chơi 1 được đại diện bởi trong đó là hành động vòng đầu tiên của người chơi 1, là hành động được thực hiện tại thông tin mà cả hai người chơi đã đào thoát trong vòng đầu tiên, là hành động được thực hiện tại bộ thông tin nơi người chơi 1 đã đào thoát và người chơi 2 đã hợp tác trong vòng 1, v.v. Lưu ý rằng một cái gì đó như (với(x11,xDD1,xDC1,xCD1,xCC1)x1xDD1xDC1(x11,x21)x21là hành động được thực hiện trong vòng 2) không bao giờ là một đặc điểm kỹ thuật đầy đủ về chiến lược của người chơi 1, vì chúng ta cần chỉ định hành vi tại mỗi thông tin được đặt riêng. Xác định các chiến lược của người chơi 2 tương tự. Tuy nhiên, trạng thái cân bằng Bayes hoàn hảo cũng phải xác định niềm tin của người chơi, . Đây là một phần quan trọng của đặc điểm kỹ thuật của trạng thái cân bằng. Như chúng ta sẽ thấy dưới đây, câu hỏi hướng đến việc hiểu rằng một trạng thái cân bằng khác nhau không đòi hỏi các chiến lược khác nhau. Một sự khác biệt trong niềm tin là đủ để tính là một trạng thái cân bằng khác nhau.μ1,μ2

Trạng thái cân bằng hoàn hảo được đưa ra bởi: cho người chơi 1 và cho người chơi 2, trong đó và là niềm tin nhất quán ở tất cả các bộ thông tin.((D,D,D,D,D),μ1)((D,D,D,D,D),μ2)μ1μ2

Như đã lưu ý trong các ý kiến, vì "khiếm khuyết" là một chiến lược thống trị bất kể niềm tin, ngay cả trong trạng thái cân bằng Bayes hoàn hảo yếu, các cấu hình chiến lược phải là cho cả hai người chơi. Tuy nhiên, sau đây cũng là trạng thái cân bằng hoàn hảo của Bayesian Nash: và với , nhất quán trên đường cân bằng.( ( D , D , D , D , D ) , μ ' 1 ) ( ( D , D , D , D , D ) , μ ' 2 ) μ ' 1 μ ' 2(D,D,D,D,D)((D,D,D,D,D),μ1)((D,D,D,D,D),μ2)μ1μ2

Do đó, câu hỏi không sai, nó chỉ đơn giản cho thấy hai điểm cân bằng Bayesian Nash hoàn hảo yếu có thể có các chiến lược giống hệt nhau miễn là chúng khác nhau về niềm tin ngoài con đường cân bằng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.