Làm thế nào để hiểu một cách trực giác 'Tiêu chí trực quan'?


25

Tiêu chí trực quan của Cho và Kreps là một sàng lọc để giảm thiểu tập hợp các cân bằng Bayes hoàn hảo trong các trò chơi báo hiệu. Một ví dụ đơn giản và trực quan để giải thích tiêu chí này là gì? Giả sử bất kỳ sinh viên đại học nào cũng có thể dễ dàng đánh giá cao sự tinh tế thông qua ví dụ.

Câu trả lời:


23

Một cách ngắn gọn, hoàn toàn không chính thức để đặt nó là thế này: Tiêu chí trực quan loại bỏ mọi niềm tin mất cân bằng chỉ có thể đúng nếu một số người chơi làm điều gì đó ngu ngốc.

Dưới đây là một lời giải thích dài dòng hơn một chút với một ví dụ không chính thức.


Trong nhiều trò chơi báo hiệu (nghĩa là các trò chơi trong đó một người chơi, người gửi có thể truyền thông tin đến một người nhận khác), thường có rất nhiều điểm cân bằng không thể tin được. Điều này xảy ra bởi vì khái niệm giải pháp Perfect Bayes không chỉ rõ niềm tin của người nhận phải là gì khi người gửi đi chệch hướng; do đó chúng ta có thể hỗ trợ rất nhiều trạng thái cân bằng chỉ bằng cách nói rằng nếu người gửi đi chệch khỏi trạng thái cân bằng đó thì anh ta sẽ bị "trừng phạt" với niềm tin rất xấu. Hình phạt như vậy thường sẽ đủ để khiến người gửi chơi một chiến lược mà nếu không sẽ không phải là một phản ứng tốt nhất.

Ví dụ, trong bài báo hiệu thị trường việc làm kinh điển của Spence có một trạng thái cân bằng trong đó các cá nhân có khả năng cao đầu tư vào giáo dục (học tập dễ dàng cho họ) trong khi những người có khả năng thấp thì không (vì họ thấy quá tốn kém khi làm như vậy). Giáo dục sau đó là một tín hiệu của khả năng. Chúng tôi có thể hỏi: có phải cũng có một trạng thái cân bằng của trò chơi này trong đó không ai chọn để có được một nền giáo dục và không có thông tin nào được truyền đến người nhận? Câu trả lời là "có". Chúng ta có thể hỗ trợ trạng thái cân bằng như vậy bằng cách nói rằng sự sai lệch trong đó người gửi được giáo dục khiến người nhận chấp nhận niềm tin rằng người gửi chắc chắn có khả năng thấp. Nếu giáo dục có tác dụng báo hiệu khả năng thấp thì dĩ nhiên, mọi người đều vui vẻ chơi cùng với trạng thái cân bằng giả định và không được giáo dục.

Một điều cũng rõ ràng là trạng thái cân bằng này không hợp lý lắm: người nhận biết rằng sẽ ít tốn kém hơn cho một đại lý có khả năng cao để có được một nền giáo dục so với một người có khả năng thấp, vì vậy anh ta không có ý nghĩa gì khi nghĩ về một nền giáo dục như báo hiệu khả năng thấp. Tiêu chí trực quan loại trừ loại cân bằng này bằng cách yêu cầu niềm tin phải "hợp lý" theo nghĩa sau:

Giả sử người nhận quan sát độ lệch khỏi trạng thái cân bằng. Người nhận không nên tin rằng người gửi thuộc loại nếu cả hai điều sau đây đều đúng:tbad

  1. sự sai lệch sẽ dẫn đến loại trở nên tồi tệ hơn sau đó nếu anh ta bị mắc kẹt vào trạng thái cân bằng cho bất kỳ niềm tin nào.tbad
  2. Có một số loại , người tốt hơn bằng cách chơi độ lệch hơn là bám vào trạng thái cân bằng cho một số niềm tin khác với t xấu .tgoodtbad

Quay trở lại mô hình báo hiệu giáo dục: Giả sử rằng điểm cân bằng là không ai có được một nền giáo dục và người nhận tin rằng sự sai lệch trong việc giáo dục báo hiệu khả năng thấp. Dự đoán những niềm tin này, một công nhân có khả năng thấp sẽ trở nên tồi tệ hơn bằng cách đi chệch hướng vì anh ta không chỉ phải chịu chi phí giáo dục mà sau đó còn bị coi là một loại tồi. Như vậy, điều kiện 1. được thỏa mãn.

Chúng ta có thể tìm thấy một số niềm tin thay thế mà người lao động khả năng cao muốn đi chệch hướng để được giáo dục không? Câu trả lời là có: nếu người nhận tin rằng giáo dục báo hiệu khả năng cao thì sự sai lệch này thực sự mang lại lợi nhuận cho loại cao. Như vậy, điều kiện 2 cũng được thỏa mãn.

Vì cả hai điều kiện đều được thỏa mãn, tiêu chí trực quan loại bỏ trạng thái cân bằng gộp hợp lý.


Tôi xin lỗi điều này quá dài dòng. Hãy cho tôi biết nếu nó không rõ ràng hoặc nếu bạn muốn một cái gì đó trang trọng hơn và tôi sẽ chỉnh sửa cho phù hợp.
Ubiquitous

Cảm ơn các câu trả lời chi tiết. Tôi sẽ rất vui nếu bạn có thể thêm một mô hình đơn giản (như một câu trả lời khác, nếu bạn muốn), trong đó việc loại bỏ 'không cân bằng' là rõ ràng về mặt toán học.
Bravo

1
Tôi đã thêm một mô hình (rất) cách điệu trong một câu trả lời riêng biệt. Tôi cũng đã chỉnh sửa điểm 1 trong hộp trích dẫn cho câu trả lời này để sửa lỗi tôi đã mắc trong định nghĩa của Tiêu chí Trực quan.
Ubiquitous

6

Đây là một mô hình đơn giản để bổ sung cho câu trả lời ít chính thức hơn của tôi:

Một công nhân là của (tư nhân nổi tiếng) loại hoặc L , mỗi với xác suất 1 / 2 . Các sản phẩm cận biên của hai loại là π H > π L . Thị trường lao động cạnh tranh để người lao động được trả sản phẩm cận biên (dự kiến) của họ. Người lao động có thể đầu tư vào giáo dục; làm như vậy chi phí loại i c i , với π H - c L < π Lπ H - c H > ( π H / 2 ) + (HL1/2πH>πLi ciπHcL<πL .πHcH>(πH/2)+(πL/2)

Trò chơi như sau: người lao động quan sát loại của mình và quyết định có nên đầu tư vào giáo dục hay không. Người sử dụng lao động sau đó quan sát thời tiết mà người lao động đã đầu tư hay không và đưa ra mức lương cạnh tranh dựa trên niềm tin của họ về năng suất của anh ta.

Hãy xem xét hai điểm cân bằng Bayesian (PBE) hoàn hảo sau đây của trò chơi.

  1. (Tách cân bằng) Loại H đầu tư; loại không đầu tư. Nếu sử dụng lao động thực hiện đầu tư sau đó họ cập nhật niềm tin của họ để Pr ( H ) = 1 và đưa ra một mức lương của π H . Nếu họ quan sát không đầu tư sau đó họ cập nhật để Pr ( H ) = 0 và cung cấp lương π L .LPr(H)=1πHPr(H)=0πL

    Chúng ta có thể kiểm tra xem đây có phải là điểm cân bằng không: mức chi trả của loại H là . Nếu anh ta đi chệch hướng để không được học hành thì mức thưởng của anh ta là π L , thấp hơn. Loại L 's thưởng phạt là π L . Nếu anh ta đi chệch hướng để được giáo dục thì mức chi trả của anh ta là π H - c L < π L , thấp hơn. Do đó, không loại nào muốn đi chệch hướng. Các đề nghị tiền lương là những phản ứng tốt nhất (tầm thường) dựa trên niềm tin bởi vì thị trường lao động cạnh tranh. Cuối cùng, lưu ý rằng niềm tin phù hợp với quy tắc của Bayes và lối chơi cân bằng của trò chơi.πHcHπLLπLπHcL<πL

  2. (Cân bằng tổng hợp) Không loại nào đầu tư. Người sử dụng lao động cập nhật niềm tin lên nếu giáo dục được quan sát và đưa ra mức lương π LPr(H)=0πL . Các gậy sử dụng lao động với niềm tin trước của và cung cấp lương ( π H / 2 ) + ( π L ) / 2 nếu giáo dục không được quan sát.Pr(H)=1/2(πH/2)+(πL)/2

    Hãy kiểm tra xem đây có phải là điểm cân bằng không. Vì giáo dục là tốn kém nhưng ảnh hưởng xấu đến niềm tin của người sử dụng vào trạng thái cân bằng, nên không có loại nào để có được giáo dục. Với sự tin tưởng và khả năng cạnh tranh của thị trường lao động, việc đưa ra mức lương giả định là tối ưu. Niềm tin là phù hợp với quy tắc Bayes' nếu không giáo dục được quan sát (vì quan sát này không chứa thông tin mới về loại của người lao động). Cuối cùng, quy tắc của Bayes không xác định niềm tin trong trường hợp đầu tư (mất cân bằng) vào giáo dục, theo định nghĩa của PBE, chúng tôi có thể tự do chỉ định bất kỳ niềm tin nào chúng tôi muốn.Pr(H)=1/2

LπHcL<πLHPr(H)=1HπHCL>πLPr(H)=0


LLHH


4

Tôi đã từng viết một ví dụ về tiêu chí Kreps bằng mô hình báo hiệu chính tắc và The Simpsons. Tôi nghĩ rằng nó đi cùng dòng với câu trả lời của @Ubiquitous 'trong khi ít chính xác và chung chung hơn nhiều. Nhưng tôi nghĩ bối cảnh của Simpsons có thể giúp ích trong môi trường sư phạm.

He1Le2>e1

e3>e2

ρ(e2)>0ρ(e1)=0

e3ρ(e3)=1e2e3ρ(e3)1

(e1,e2,ρ)ρ(e3)e3Le3e3e3H

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.