Nguy hiểm đạo đức với tác nhân trung lập rủi ro


8

Chúng tôi có một mô hình đại lý chính với các hành động ẩn trong đó hiệu trưởng không thích rủi ro và đại lý là trung lập rủi ro; Giả sử cũng có hai mức đầu ra, và (với ) và hai hành động . Xác định xác suất của theo các hành động tương ứng. Ngoài ra, độ bất đồng tác nhân từ hành động là . Tiền lương liên quan đến lần lượt là . xxx>xa,ap(a),p(a)xa,aa1x,xw,w

Vấn đề của tôi là tôi không chắc chắn làm thế nào để chỉ ra rằng hợp đồng tối ưu yêu cầu , tức là tác nhân, là trung lập rủi ro, đảm nhận tất cả các biến đổi liên quan đến dự án.xw=xw

Tôi chính thức hóa vấn đề (giả sử hiệu trưởng muốn gây ra , nếu không câu hỏi của tôi là tầm thường)a

max{w,w}u(xw)p(a)+u(xw)(1p(a))

thứ

wp(a)+w(1p(a))10

wp(a)+w(1p(a))1wp(a)+w(1p(a))

Đặc biệt, khi tôi cố gắng giải quyết vấn đề bằng cách tối đa hóa khoản thanh toán gốc dự kiến ​​theo tính hợp lý cá nhân "tiêu chuẩn" (với số nhân λ ) và các ràng buộc khuyến khích (với số nhân μ ) (tôi cho rằng hiệu trưởng quan tâm nhiều hơn hành động tốn kém a ) Tôi kết thúc với hai phương trình không phù hợp với kết quả đã nói ở trên. Đặc biệt:

u(xw)=λ+μ[1(1p(a))(1p(a))]

u(xw)=λ+μ[1p(a)p(a)]

Rõ ràng là giữ iff không phải là trường hợp trong vấn đề này (ở đây chúng ta có ). Một khả năng khác là giả định rằng ràng buộc tương thích Ưu đãi là chùng (do đó ); tuy nhiên tôi không thể hiểu tại sao nên giữ, khi hiệu trưởng muốn gây ra hành động tốn kém nhất (trợ giúp ở đây) p ( một ) = p ( một ' ) p ( một ' ) > p ( một ) μ = 0 một 'xw=xwp(a)=p(a)p(a)>p(a)μ=0a

Tôi đã đọc trên mạng rằng một cách tiếp cận khác sẽ là giả định rằng hiệu trưởng "bán" dự án cho đại lý và đại lý, sau khi chọn mức độ nỗ lực tối đa hóa tiện ích dự kiến ​​của mình, trả lại một khoản cố định cho hiệu trưởng (gọi đó là )βa,βa

Vì vậy, chúng tôi sẽ có một cái gì đó như:

w ' p ( một ) + w ( 1 - p ( một ) ) - β một0wp(a)+w(1p(a))1βa0 nếu tác nhân chọn thực hiện nỗ lực cao và nếu không.wp(a)+w(1p(a))βa0

Nhưng sau đó làm thế nào để đi từ đó? Làm thế nào để đảm bảo rằng tác nhân sẽ chọn hành động ? Làm thế nào là số tiền cố định được xác định? Tại sao chúng tối ưu?a


Một gợi ý: Với thiết lập của bạn, không nhất thiết là hành động hiệu quả và do đó, hiệu trưởng không nhất thiết muốn gây ra nó. Bạn có muốn mọi người cho rằng nó là? a
Shane

@Shane Điều này được nêu trong câu hỏi: "giả sử hiệu trưởng muốn tạo ra "a
Giskard

@denesp Điều đó đúng, nhưng điều quan trọng là phải biết liệu có thực sự hiệu quả hay không, bởi vì, với tác nhân trung lập rủi ro, bán dự án cho đại lý sẽ là tối ưu cho dù thế nào, nhưng sẽ chỉ tạo ra nếu nó hiệu quả. Nếu không hiệu quả nhưng hiệu trưởng muốn tạo ra nó bất kể, thì toàn bộ khái niệm hợp đồng tối ưu bị xóa nhòa - chúng ta sẽ tìm thấy hợp đồng tối ưu từ một tập hợp đồng tạo ra sự lựa chọn dưới mức tối ưu. một ' một 'aaa
Shane

Hiệu trưởng chỉ có thể thực hiện thanh toán để tạo ra một ', số tiền dựa trên bất kỳ tiện ích nào mà hiệu trưởng nhận được từ hành động này.
DJ Sims

1
"Tiền lương" có thể âm hay bằng 0?
Alecos Papadopoulos

Câu trả lời:


3

Câu trả lời này cho thấy ba điều:

  1. Chúng tôi không cần cách tiếp cận Lagrangian để giải quyết vấn đề tối đa hóa của bạn.
  2. Chúng ta không cần giả định rằng .xx=1p(a)p(a)
  3. Điều kiện không nhất thiết phải thỏa mãn cho hợp đồng tối ưu.xw=xw

Sửa chữa thực sự thanh toán . Vấn đề có thể được viết với các ràng buộc Rõ ràng là hiệu trưởng có lợi ích để đặt giá trị thấp nhất có thể cho với tập ràng buộc này, vì hàm mục tiêu đang giảm trong . Do đó, anh ta sẽ đặt max w ' u ( x ' - w ' ) p ( một ' )w

maxwu(xw)p(a)
w'w'w'=max{1-w[1-p(một')]
wp(a)1w[1p(a)]w[p(a)p(a)]1+w[p(a)p(a)]
ww
w=max{1w[1p(a)]p(a),1+w[p(a)p(a)]p(a)p(a)}

Như @Alecos_Papadopoulos đã làm, sẽ hợp lý khi cho rằng đại lý được bảo vệ bởi trách nhiệm hữu hạn, nghĩa là các khoản thanh toán của anh ta là không có lợi. Mặt khác, vấn đề không nhất thiết phải có giải pháp: hiệu trưởng luôn có thể hưởng lợi từ việc giảm và tăng để giữ cho ràng buộc tính hợp lý cá nhân được thỏa mãn. Nhưng hợp đồng rõ ràng không phải là một giải pháp thỏa đáng. Do đó, tôi hạn chế chú ý đến trường hợp và .w ' ( w = - , w ' = + ) w 0 w '0ww(w=,w=+)w0w0

Điều kiện ngụ ý và do đó 1 + w [ p ( một ' ) - p ( một ) ]w0 w'=1+w[p(một')-p(một)]

1+w[p(a)p(a)]p(a)p(a)1w[1p(a)]p(a)
w=1+w[p(a)p(a)]p(a)p(a)

Cắm phương trình này vào hàm mục tiêu, bài toán của hiệu trưởng trở thành

ww=0w'=1

maxw0u(x1p(a)p(a)w)p(a)+u(xw)(1p(a))
Hàm mục tiêu này đang giảm trong . Do đó, anh ta chỉ cần đặt và . Để kết luận, đẳng thức không có lý do gì để thỏa mãn trừ khi người ta cho rằng , tức là Phương trình sau này có nghĩa là thặng dư xã hội do bằng với thặng dư kết quả từww=0w=1p(a)p(a)xw=xwxx=1p(a)p(a)
p(a)x+(1p(a))x1=p(a)x+(1p(a))x
aa: đó là một trường hợp rất đặc biệt trong đó chi phí nỗ lực cho đại lý được bù đắp chính xác bằng sự gia tăng sản lượng dự kiến ​​cho tiền gốc. Trong tất cả các trường hợp khác, chúng tôi có .xwxw

Tôi nghĩ lý do tại sao các đại lý không chịu mọi rủi ro là vì hành động của anh ta không thể quan sát được, và do đó không thể hợp đồng. Khách sạn này sẽ đúng trong nền kinh tế chia sẻ rủi ro với phân bổ không bị ràng buộc. Nhưng việc phân bổ ở đây bị bóp méo bởi nhu cầu khuyến khích các đại lý để nỗ lực cao.


(+1) Đó là một cách tiếp cận tốt, tôi chỉ muốn trở nên trang trọng với những vấn đề đơn giản. Một vấn đề cuối cùng với thiết lập của OP: vì là tùy ý, không có gì đảm bảo rằng . xx1/(pp)
Alecos Papadopoulos

Tôi không nghĩ rằng "hiệu trưởng luôn có thể hưởng lợi từ việc giảm và tăng để giữ cho sự hạn chế về lý trí cá nhân được thỏa mãn." là đúng. Ý tôi là có những trường hợp bạn không thể vừa có lợi vừa giữ được sự hạn chế tham gia. ww
Giskard

@denesp Tôi nghĩ rằng đó là true.Take tiêu cực và đủ nhỏ, và để làm hài lòng cả những hạn chế. Hàm mục tiêu của hiệu trưởng là và hàm này giảm nghiêm ngặt trong , khi đủ nhỏ. Do đó, hiệu trưởng luôn có thể làm tốt hơn bằng cách hạ thấp và đặt : không có phương pháp hữu hạn nào là tối ưu. ww=1w(1p(a))p(a)
u(x1p(a)+w1p(a)p(a))p(a)+u(xw)(1p(a))
wwww=1w(1p(a))p(a)
Oliv

@Alecos Papadopoulos cảm ơn bạn. Tại sao bạn muốn đảm bảo rằng ? x1pp
Oliv

@Oliv Nếu , thì doanh thu thuần cho tiền gốc là âm nếu xảy ra, trong khi đó là dương nếu xảy ra (với ). Trong thực tế ngay cả khi , chúng tôi vẫn ở trong tình huống hiệu trưởng muốn gây ra hành động , mặc dù tiện ích có điều kiện thấp hơn nếu xảy ra. Điều này sẽ đòi hỏi một điều trị toàn diện hơn, để xác định những gì thực sự tối ưu ở đây. Chắc chắn, chúng ta có thể chấp nhận vấn đề như vậy, với tất cả các giả định của nó được coi là givens ad hoc, nhưng tôi thích các vấn đề chỉ chống lại trực giác nếu cuối cùng, chúng có thể giải thích rõ ràng tại sao. x<1/(pp)xxw=00<x1/(pp)<xax
Alecos Papadopoulos

4

Một điều làm phiền tôi ở đây là: ràng buộc tương thích khuyến khích là

IC:wp(a)+w(1p(a))1wp(a)+w(1p(a))

(1)ww1p(a)p(a)

... Kể từ khi giả định . Chúng tôi được thông báo rằng chúng tôi sẽ thấy rằng ở mức tối ưu, p(a)p(a)>0

(2)xw=xwxx=ww

Kết hợp và , nếu thực sự đây là tối ưu theo các ràng buộc nhất định, chúng ta cũng phải có(1)(2)

(3)xx1p(a)p(a)

Nhưng đây là một hạn chế bổ sung, cần thiết đối với cường độ tiên nghiệm, phải giữ nếu giải pháp tối ưu được đề xuất là có thể được chấp nhận. Ngay cả khi thực sự có một ràng buộc như vậy, trong mọi trường hợp, nó sẽ làm giảm rõ rệt tính tổng quát của vấn đề (có nghĩa là thể hiện một cái gì đó chung chung, tức là tính trung lập rủi ro của tác nhân ảnh hưởng đến giải pháp như thế nào).

Tuy nhiên, hãy làm việc này chính thức hơn một chút. Tôi sẽ giả sử rằng có thể bằng 0, nhưng không âm. Đây là một vấn đề tối đa hóa ở dạng bình thường với các ràng buộc bất bình đẳng, các biến quyết định không âm và bội số không âm. Do đó, Lagrangean đầy đủ của vấn đề là (Tôi sẽ thu gọn ký hiệu một cách rõ ràng),w,w

Λ=u(xw)p+u(xw)(1p)+λ[wp+w(1p)1]+μ[wp+w(1p)1wpw(1p)]+ξw+ξw

Các điều kiện đặt hàng đầu tiên cần thiết là

Λw0,Λww=0

và tương tự cho . Những kết quả này trongw

Λw=u(xw)(1p)+λ(1p)μ(pp)+ξ0

u(xw)(1p)λ(1p)μ(pp)+ξ

(4)u(xw)λμpp1p+ξ1p

Λw=u(xw)p+λp+μ(pp)+ξ0

(5)u(xw)λ+μpp1p+ξp

Đầu tiên lưu ý rằng không phải cả hai tiền lương đều có thể bằng 0, vì các ràng buộc sẽ bị vi phạm. Vì điều này, hãy xem xét khả năng bị ràng buộc (vì vậy ). Nếu nó là ràng buộc, thì với cả hai mức lương bằng 0, ràng buộc sẽ nhất thiết bị vi phạm. Vì vậy, chúng tôi kết luận rằngIRλ>0IC

λ=0

và các điều kiện đặt hàng đầu tiên bây giờ trở thành

(4a)u(xw)μpp1p+ξ1p

(5a)u(xw)μpp1p+ξp

Bây giờ lưu ý rằng nếu (tức là ) thì sẽ giữ như một đẳng thức và với số hạng cuối cùng bên phải bằng 0. Nhưng điều này sẽ đòi hỏi tiện ích cận biên không thể chấp nhận được. Chúng tôi cũng biết rằng không phải cả hai tiền lương đều có thể bằng không. Vì vậy, chúng tôi kết luận rằng chúng ta phải cóξ=0w>0(4a)

ξ>0,w=0,ξ=0,w>0

và các điều kiện bây giờ trở thành

(4b)u(x)μpp1p+ξ1p

(5b)u(xw)=μpp1p

Phương trình ngụ ý rằng , theo thông số chức năng tiện ích thông thường, không cung cấp tiện ích cận biên bằng 0, ngoại trừ ở vô cực. Đến lượt điều này có nghĩa là ràng buộc phải giữ như một đẳng thức. Cho rằng điều này mang lại(5b)μ>0ICw=0

(6)IC:wp1wp=0=w=1pp

Điều này sẽ rung chuông, vì phía bên phải của giống như bên phải của và .(6)(1)(3)

Cụ thể, nếu chúng ta giả sử một tiên nghiệm rằng , thì giải pháp mà chúng tôi đã đưa ra để xác thực xác nhận quyền sở hữuxx=1ppxw=xw

Theo giả định bổ sung này, chúng tôi cũng có được

(4c)u(x)μpp1p+ξ1p

(5c)u(x)=μpp1p

Kết hợp, chúng tôi có được

μpp1pμpp1p+ξ1p

(7)μξ2(pp)

Điều này được chấp nhận . Vì vậy, dưới , chúng tôi thu được giải phápxx=1pp

{w=xx=1/(pp),w=0,λ=0,μξ2(pp),ξ>0,ξ=0}
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.