Tôi có thể tinh chỉnh bộ cân bằng trong trò chơi báo hiệu cho kết quả tối ưu của người gửi không?


12

Câu hỏi chính: Tôi đã đọc về các trò chơi giao tiếp rất nhiều và tôi tự hỏi liệu có những tiêu chí tốt để lựa chọn giữa hai trạng thái cân bằng tách biệt. Tôi nghĩ về một cân bằng riêng biệt như cân bằng phối hợp giữa các loại. Vì vậy, nếu chúng ta cấp cho các loại này phối hợp thành công, tại sao chúng ta sẽ không cho phép chúng phối hợp với trạng thái cân bằng tối ưu của người gửi (theo hiệu quả Pareto giữa các người gửi)? Đó là, giả sử có một trạng thái cân bằng tuần tự duy nhất trong đó tất cả người gửi thực hiện tốt hơn so với trạng thái cân bằng còn lại. Có những đối số nào để chọn trạng thái cân bằng này?


Hãy xem xét các trò chơi truyền thông sau đây. Tiền thưởng của người nhận là số thứ hai trong cặp. Có sáu loại người gửi, với số tiền được đưa ra là yếu tố đầu tiên của các cặp. Tôi sẽ chỉ ra rằng có một trạng thái cân bằng gộp và ít nhất hai lần tách một phần. Tôi đang tự hỏi loại kỹ thuật nào có thể được sử dụng để tranh luận có lợi cho việc cân bằng riêng biệt. Một là tối ưu hóa người gửi và hai là tối ưu hóa người nhận.

ActionBActionLActionRActionLLActionRRtypeB(0,3)(1,2)(1,2)(2,1)(2,1)typeL(0,2)(1,3)(1,2)(2,0)(2,2.25)typeR(0,2)(1,2)(1,3)(2,2.25)(2,0)typeLL(0,1)(1,2)(1,0)(2,3)(2,1)typeRR(0,1)(1,0)(1,2)(2,1)(2,3)typeH(0,0)(1,0.9)(1,0.9)(2,3.1)(2,3.1)

Đặt chúng là phân phối trước trên các loại trong đó π ( B ) = .3 , π ( L ) = π ( R ) = .2 , π ( L L ) = π ( R R ) = .1 , π ( H ) = .1 .π

π(B)=.3,π(L)=π(R)=.2,π(LL)=π(RR)=.1,π(H)=.1.

Ở trạng thái cân bằng gộp, người nhận sẽ thực hiện hành động cho mức chi trả dự kiến E U 2 ( B ) = .3 ( 3 ) + .4 ( 2 ) + .2 ( 1 ) = 1.9 , vượt ra khỏi E U 2 ( L ) = .3 ( 2 ) + .2 ( 3 ) + .2 ( 2 ) + .1 ( 2 ) +BEU2(B)=.3(3)+.4(2)+.2(1)=1.9 .EU2(L)=.3(2)+.2(3)+.2(2)+.1(2)+.1(.9)=1.89

Tuy nhiên, có một số cân bằng tách.

Tách 1 Cho các loại "hỏi" cho hành động L , loại RR R "yêu cầu" cho R và sau đó BH trộn 50/50 giữa hai tín hiệu. Hãy để các thông điệp là lr với sự giải thích tự nhiên.L,LLLRRRRBHlr

Vậy EU2(Ll)Pr(l)=.15(2)+.2(3)+.1(2)+.025(1)=1.125=EU2(Rr)Pr(r)

Vì vậy, người nhận kiếm được trong kỳ vọng. Những người gửi cũng tốt hơn.2.25

Tách 2 Nhưng hãy xem xét một loại tách khác. Loại L L luôn gửi một thông điệp l l , "xin" cho hành động L L . Loại LR R gửi r r , yêu cầu hành động R R . Một lần nữa, BH ngẫu nhiên đồng đều.RLLllLLLRRrrRRBH

Khi đó, EU2(RRrr)Pr(rr)=.15(1)+.2(2.25)+.1(3)+.025(3.1)=.9775=EU2(LLll)Pr(ll). Mức chi trả dự kiến ​​là 1.955 vì mỗi tin nhắn được nhận một nửa thời gian.

rrRllLLRRLR

Dường như với tôi rằng trạng thái cân bằng cuối cùng này mạnh mẽ hơn. Có hai trạng thái cân bằng riêng biệt, đòi hỏi sự phối hợp. Cấp cho người gửi có thể phối hợp, tại sao họ không phối hợp theo cách tối ưu của người gửi?

Tôi tự hỏi liệu có phương pháp nào tồn tại sẽ tinh chỉnh bộ cân bằng để loại trừ sự tách biệt tối ưu của người nhận không. Điểm cân bằng đầu tiên có thể được cho là không phải là bằng chứng thần kinh học.

llrr


Tôi tò mò về cách bạn tính toán tiền thưởng của người gửi ở đây. Có vẻ như đó là tiền thưởng của người gửi mà bạn đang sử dụng để đánh giá sự lạc quan. Nhưng phân phối khách quan của các loại người gửi là gì? Có giống như trước của người nhận không?
Herr K.

Vâng, ex ante. Mục tiêu giống như trước.
Pburg

Bạn có muốn nghe về các đối số đầu mối, hoặc bạn đang tìm kiếm một số sàng lọc cân bằng "tiêu chuẩn" hơn?
Martin Van der Linden

Tốt hơn là một cái gì đó tiêu chuẩn hơn, nhưng tiêu điểm cũng sẽ được hoan nghênh.
Pburg

2
Một câu trả lời tầm thường là bạn chỉ cần chọn trạng thái cân bằng tối ưu Pareto. Nhiều bài báo làm điều này, thường là với một cụm từ như "tập trung vào trạng thái cân bằng tối ưu của người gửi". Một lời biện minh là trong Mailath, Okuno-Fujiwara và Postlewaite (1993). Một cách tiếp cận nguyên tắc hơn là thêm tiếng ồn, sao cho mọi tin nhắn được gửi bởi mọi loại với xác suất dương. Xác suất gần bằng 1 đối với tin nhắn dự định và gần bằng 0 đối với ngoài ý muốn. Bạn có thể lấy xác suất lỗi về 0 và sử dụng trạng thái cân bằng giới hạn làm sàng lọc. Cấu trúc lỗi khác nhau => cân bằng được chọn khác nhau.
Sander Heinsalu
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.