Giả sử có một trò chơi truyền tín hiệu với một không gian thông điệp hữu hạn , hữu hạn hành động không gian , và hữu hạn kiểu không gian . Thậm chí đơn giản hơn, tất cả các loại người gửi đều có sở thích giống hệt nhau (người nhận chỉ thích các hành động khác nhau để đáp ứng với các loại khác nhau). Người nhận có thể làm tốt hơn bằng cách ngẫu nhiên giữa các câu trả lời không? Khi trạng thái cân bằng tồn tại mà người nhận chỉ thực hiện các hành động thuần túy?
Ubiquitous đã tóm tắt câu hỏi của tôi một cách độc đáo, "Có bao giờ trường hợp cân bằng với mức chi trả cao nhất của người nhận nhất thiết phải liên quan đến các chiến lược hỗn hợp không?"
Hãy đi với trạng thái cân bằng tuần tự. Nếu bạn muốn một số ký hiệu để bắt đầu.
là xác suất mà gửi .
là xác suất mà người nhận phản ứng với với cho niềm tin của người nhận sau khi quan sát .
Một trạng thái cân bằng tuần tự đòi hỏi cho phản ứng tối ưu cho , là được tối ưu và là Bayesian cho . Đây thực sự là định nghĩa của một tuần tự yếu, nhưng không có sự phân biệt trong một trò chơi báo hiệu.
Trực giác của tôi nói không khi tồn tại trạng thái cân bằng trong đó người nhận chỉ đóng những hành động thuần túy, nhưng tôi luôn thấy kinh khủng với những thứ này. Có lẽ chúng ta cũng phải quy định rằng đó không phải là một trò chơi có tổng bằng 0, nhưng tôi chỉ nói điều đó bởi vì tôi nhớ người chơi sẽ tốt hơn với khả năng chọn ngẫu nhiên trong các trò chơi đó. Có lẽ đây là một chú thích trong một bài báo ở đâu đó?
Hãy xem xét các trò chơi dưới đây, nơi sở thích của người gửi không giống nhau. Tôi xin lỗi vì chất lượng thấp. Có ba loại người gửi, mỗi loại có khả năng như nhau. Chúng ta có thể tạo ra thứ mà tôi tin là trạng thái cân bằng tối ưu của người nhận (người chơi 2) chỉ khi họ ngẫu nhiên hóa khi nhận được tin nhắn 1. Sau đó, loại 1 và 3 sẽ chơi , tạo ra trạng thái cân bằng riêng biệt. Nếu người nhận sử dụng chiến lược thuần túy để đáp ứng với m 1 , thì loại 1 hoặc 2 sẽ sai lệch và khiến người nhận trở nên tồi tệ hơn.