Tại sao quan tâm rất nhiều về tiện ích dự kiến?


8

Tôi có một câu hỏi ngây thơ về lý thuyết quyết định. Chúng tôi tính toán xác suất của các kết quả khác nhau giả định các quyết định cụ thể và gán các tiện ích hoặc chi phí cho từng kết quả. Chúng tôi tìm thấy quyết định tối ưu bằng cách tìm ra một trong những tiện ích được mong đợi lớn nhất.

Nhưng tại sao chúng ta nên lý luận theo cách này? Mỗi quyết định trong thực tế có một phân phối tiện ích liên quan đến nó. Tại sao chúng ta so sánh sự phân phối của các tiện ích cho các lựa chọn khác nhau chỉ bằng một thống kê tóm tắt duy nhất? Và tại sao chúng ta chọn giá trị trung bình thay vì chế độ hoặc trung vị, v.v?

Tôi có thể tưởng tượng các trường hợp trong đó hai lựa chọn mang lại các tiện ích dự kiến ​​giống hệt nhau nhưng phân phối của chúng cho tiện ích này khác nhau rất nhiều. Chắc chắn các quyết định nên được đưa ra dựa trên toàn bộ phân phối chứ không phải kỳ vọng một mình?

Có phải chúng ta đang nói rằng đối với bất kỳ sơ đồ nào để đưa ra quyết định sử dụng toàn bộ phân phối, phải tồn tại một chức năng tiện ích mà tiện ích dự kiến ​​tối đa sẽ cho kết quả giống hệt nhau? Nếu vậy, dù sao chúng ta cũng không nên xây dựng các tiện ích một cách trung thực và chọn quy tắc quyết định theo ý muốn? Sau này chúng ta có thể chuyển đổi các tiện ích trung thành của mình sang các tiện ích mang lại kết quả giống hệt nhau với kỳ vọng tối đa.


3
Xem ví dụ ch. 2.2 trong C. Robert (2007) "Sự lựa chọn Bayes" để xem xét các tiên đề làm cơ sở cho sự tồn tại của chức năng tiện ích.
Jarle Tufto

1
+1 cho @JarleTufto. Cũng lưu ý rằng khi bạn thực hiện suy luận Bayes, bạn không cần chọn giá trị số ít cho tham số lập chỉ mục tiện ích . Thay vào đó, bạn tự giao nhiệm vụ xây dựng một bản phân phối over để giảm thiểu tổn thất [khả năng đăng nhập] dự kiến ​​(tối đa hóa tiện ích dự kiến) như thường lệ theo niềm tin trước đó của bạn. θπθ
Jeremias K

Câu trả lời:


8

Các tiện ích Von Neumann-Morgenstern lý ngụ ý rằng theo một số giả định hợp lý (ví dụ như thực tế là bạn có thể đặt một tập hợp các kịch bản từ tốt nhất để tồi tệ nhất, trong đó mỗi kịch bản stochastically giải quyết đối với một số kết quả), sau đó có tồn tại một hàm ánh xạ mỗi kết quả có thể xảy ra với một giá trị thực ("tiện ích"), như vậy bạn sẽ luôn thích kịch bản với tiện ích được mong đợi cao hơn. Do đó, thật hợp lý khi luôn chọn lựa chọn tối đa hóa tiện ích mong đợi.

Tôi có thể tưởng tượng các trường hợp trong đó hai lựa chọn mang lại các tiện ích dự kiến ​​giống hệt nhau nhưng phân phối của chúng cho tiện ích này khác nhau rất nhiều.

Tiện ích của Almaty tính đến điều này để ngay cả khi bạn không thích rủi ro , kịch bản tiện ích được mong đợi cao nhất sẽ được ưu tiên nhất.

Có phải chúng ta đang nói rằng đối với bất kỳ sơ đồ nào để đưa ra quyết định sử dụng toàn bộ phân phối, phải tồn tại một chức năng tiện ích mà tiện ích dự kiến ​​tối đa sẽ cho kết quả giống hệt nhau? Nếu vậy, dù sao chúng ta cũng không nên xây dựng các tiện ích một cách trung thực và chọn quy tắc quyết định theo ý muốn? Sau này chúng ta có thể chuyển đổi các tiện ích trung thành của mình sang các tiện ích cho kết quả giống hệt nhau với kỳ vọng tối đa.

Tôi muốn nói rằng chiến lược xấp xỉ tiện ích của một số kết quả nhất định thông qua phỏng đoán hoặc một số phương pháp phỏng đoán của con người dẫn đến việc ra quyết định không hoàn hảo, vì chức năng tiện ích kết quả khác với tiện ích ích lợi của KFC. Xây dựng các tiện ích "một cách trung thực" sẽ giải quyết vấn đề và làm cho nó để tối đa hóa tiện ích mang lại câu trả lời đúng.


1

Câu trả lời của tôi có thể làm bạn ngạc nhiên. Tôi sẽ trả lời nó trong lý thuyết tiện ích dự kiến, và hơn thế nữa.

Tiện ích ngoài mong đợi

Lý thuyết tiện ích dự kiến ​​của nó không phải là cách duy nhất để đưa ra quyết định. Cho dù bạn sử dụng lý thuyết tiện ích hay không phụ thuộc vào các ứng dụng. Ví dụ, trong quản lý tài sản, một số cố vấn sử dụng lý thuyết triển vọng thay vì tiện ích dự kiến. Kahneman nhận giải thưởng Nobel về kinh tế cho công trình nghiên cứu về lý thuyết này. Nó đưa ra các khía cạnh hành vi của việc ra quyết định trong kinh tế vượt ra ngoài lý thuyết tiện ích dự kiến.

Thực tế, theo cách tiếp cận lựa chọn danh mục đầu tư truyền thống , các cố vấn giàu có cố gắng xây dựng chức năng tiện ích của khách hàng, sau đó sử dụng nó để chọn danh mục đầu tư tốt nhất trên biên giới hiệu quả. Theo cách tiếp cận lý thuyết triển vọng, các cố vấn cố gắng xây dựng hàm giá trị thay vì hàm tiện ích và sử dụng hàm trước để chọn danh mục đầu tư tốt nhất.

Trong lý thuyết tiện ích dự kiến

Tôi có thể tưởng tượng các trường hợp trong đó hai lựa chọn mang lại các tiện ích dự kiến ​​giống hệt nhau nhưng phân phối của chúng cho tiện ích này khác nhau rất nhiều. Chắc chắn các quyết định nên được đưa ra dựa trên toàn bộ phân phối chứ không phải kỳ vọng một mình?

Bây giờ, ngay cả trong lý thuyết tiện ích truyền thống, điều này được quan tâm. Chẳng hạn, họ có một khái niệm về ác cảm rủi ro và sự thống trị ngẫu nhiên . Một người không thích rủi ro sẽ không chọn quyết định chỉ dựa trên tiện ích dự kiến. Đó sẽ là một người trung lập rủi ro . Chẳng hạn, những người không thích rủi ro sẽ thích các quyết định với entropy thấp hơn khi được đưa ra với các quyết định có cùng tiện ích dự kiến. Điều này được gọi là sự thống trị ngẫu nhiên.

Sự tương tự sẽ được xem xét hai phân phối nromal với cùng một phân tán trung bình nhưng khác nhau. Vâng, đây là những bản phân phối khác nhau và vấn đề phân tán trong nhiều ứng dụng. Tuy nhiên, điều này không làm giảm tầm quan trọng của việc biết giá trị trung bình. Để xác định đầy đủ phân phối bình thường, bạn cần biết cả trung bình và phân tán, và chính trung bình đó cho chúng ta biết rất nhiều về phân phối. Tương tự, tiện ích dự kiến ​​không phải là điều duy nhất bạn cần biết về chức năng tiện ích của đại lý, tuy nhiên nó vẫn có rất nhiều thông tin.


0

Ở mức độ lớn, đây thực sự là một câu hỏi về giá trị dự kiến, đã được thảo luận ở những nơi khác nhau . Bạn đã đúng, rằng chúng tôi đangnên quan tâm đến toàn bộ phân phối, nhưng thật khó để so sánh toàn bộ phân phối và so sánh các tóm tắt điểm đơn dễ dàng hơn nhiều. Có, bạn có thể so sánh các tóm tắt điểm đơn khác, và trong nhiều trường hợp bạn sẽ so sánh chúng, nhưng giá trị mong đợi có một số thuộc tính đẹp làm cho nó tóm tắt một điểm rất tốt cho một biến ngẫu nhiên. Giá trị dự kiến ​​sẽ cân nhắc các kết quả có thể xảy ra bởi xác suất của chúngvà cho bạn biết những gì bạn có thể "mong đợi" trong thời gian dài. Nếu bạn chơi với sòng bạc, giá trị kỳ vọng của những chiến thắng và thua lỗ có thể là tiêu cực đối với bạn, vì vậy nó sẽ cho bạn biết rằng về lâu dài bạn không nên kỳ vọng nó sẽ giúp bạn trở nên giàu có.

Hãy để tôi cung cấp cho bạn ví dụ rất nghiêm ngặt về mặt lý thuyết trò chơi. Hãy tưởng tượng rằng bạn đang xem xét chơi roulette Nga , bạn sẽ tự bắn một phát về phía mình bằng khẩu súng lục ổ quay sáu viên chỉ có một viên đạn trong buồng. Nếu không có gì xảy ra, bạn giành được $ 1000, nếu không bạn sẽ chết. Kết quả chế độ là bạn giành được 1000 đô la , tương đương với trung vị. Giá trị dự kiến ​​từ trò chơi này là 5/6× $ 1000+ 1/6 ×cái chết, bạn sẽ xem xét chơi? Tất nhiên trong cách tiếp cận lý thuyết trò chơi, bạn sẽ xem xét đâu là tiện ích thực sự của tiền thắng và giá chết là bao nhiêu, nhưng tôi đoán rằng không cần đi sâu hơn, bạn nên xem điểm sử dụng giá trị kỳ vọng như một tóm tắt điểm duy nhất ở đây .

Giá trị mong đợi (và có nghĩa là, công cụ ước tính của nó) rất nhạy cảm với các ngoại lệ và đây là một trong những lý do tại sao sử dụng nó rất nhiều. Bạn thậm chí sẽ xem xét sự cạnh tranh nếu giá là $ 1? Còn $ 1 000 000 000 thì sao? Lưu ý rằng nếu bạn đang sử dụng chế độ hoặc trung vị làm tiêu chí cho kết quả "có thể", bạn không nên quan tâm vì trong mỗi trường hợp họ nói với bạn rằng bạn thắng "trung bình". Bạn sẽ thay đổi ý định nếu bạn đang bắn bằng những viên đạn trắng? Lưu ý rằng cả chế độ và trung vị đều không thay đổi nếu bạn đang sử dụng khoảng trắng, vì chúng không quan tâm đến kết quả cực đoan, nhưng giá trị mong đợi sẽ thay đổi đáng kể * . Giá trị mong đợi (và có nghĩa là) xem xét tất cả các kết quả có thể xảy ra và cân nhắc chúng theo xác suất, đó là lý do để sử dụng nó trong kịch bản quyết định.

Ví dụ thực tế hơn sẽ là xổ số với 1000 phiếu giảm giá và chỉ một phiếu giảm giá duy nhất. Giả sử giá là $ 1000, vì vậy giá trị dự kiến ​​là 999/1000× $ 0+ 1/1000 × $ 1000 = $ 1, vì vậy phiếu giảm giá không đáng để mua nếu giá của nó không thấp hơn $ 1. Điều này có nghĩa là nếu bạn chơi trò chơi nhiều lần, bạn sẽ thắng vài lần và mất rất nhiều lần và số dư tổng thể trong số tiền đầu tư và tiền thắng cuộc sẽ xấp xỉ $ 1. Nếu giải thưởng sẽ thay đổi thành $ 10 000, mà không thay đổi giá phiếu giảm giá, câu chuyện sẽ khác vì giá trị dự kiến ​​sẽ thay đổi thành $ 10. Một lần nữa, chế độ hoặc trung vị trong cả hai trường hợp $ 0, vì vậy chúng không nhạy cảm với số tiền chi trả. Điều này không nói rằng chúng là vô dụng, nhưng nó cho thấy giá trị mong đợi là thứ chúng ta thường cần ở đây.

* - Thành thật mà nói, ví dụ này là sai lệch, vì bạn có thể tự sát bằng những khoảng trống , nhưng để tranh luận, hãy nói rằng bạn có một số khoảng trống "an toàn" giả định.


Hmm cảm ơn nhưng tôi đang tìm giải thích tổng quát hơn. Tôi khá thoải mái với ví dụ Roulette Nga
innisfree

@innisfree Ý bạn là gì khi giải thích chung chung hơn?
Tim

1
Kết quả chung và nhận xét về tiện ích dự kiến ​​tối đa so với các đề án thay thế để đưa ra lựa chọn.
innisfree

@innisfree Đây là những gì tôi đã cố gắng thể hiện, vui lòng xem chỉnh sửa của tôi, có thể nó giúp.
Tim

Thú vị, nhưng hầu như không hấp dẫn. Đúng là trung bình nhạy cảm vớip(x) cho tất cả x, nhưng bất kỳ chức năng khác của phân phối. Và nếu bạn xem xét tất cả, về cơ bản, bạn đang xem xét tất cả các khoảnh khắc của phân phối, về cơ bản là phân phối.
innisfree

0

Trong câu trả lời của họ, @shimao tập trung vào định lý tiện ích von Neumann-Morgenstern . Định lý thực sự nằm ở trung tâm của lý do tại sao chúng ta xem xét tiện ích dự kiến, thay vì bất kỳ thống kê tóm tắt nào khác về tiện ích, hoặc thực sự là toàn bộ phân phối tiện ích.

Định lý cho thấy, từ một số tiên đề, rằng khi gặp sự không chắc chắn, người ra quyết định nên chọn hướng hành động tối đa hóa tiện ích mong đợi. Tôi nghĩ rằng tiên đề có liên quan đến câu hỏi của tôi là tiên đề của sự liên tục.

Chúng tôi xếp hạng ba lựa chọn có thể theo thứ tự, nói, LMN, Ở đâu AB chỉ ra rằng một kết quả A tồi tệ hơn hoặc không tốt hơn kết quả B. Tiên đề của tính liên tục rằng phải tồn tại một xác suất,p, như vậy mà lấy tùy chọn L với xác suất p và tùy chọn N với xác suất 1p phải tốt như chỉ là lựa chọn M, tức là có tồn tại một p như vậy mà

pL+(1p)NM
Không lặp lại bằng chứng đầy đủ, rõ ràng điều này cho thấy tại sao phương sai (hoặc bất kỳ khoảnh khắc nào khác) của tiện ích không quan trọng. Không quan trọng kết quả cực đoan như thế nàoLN là, tiên đề của chúng ta là phải tồn tại một xác suất sao cho lựa chọn đó L với xác suất pN nếu không thì cũng là một lựa chọn tốt như gắn bó với M. Điều này là bất chấp thực tế là trước đây có thể có một sự khác biệt lớn về tiện ích.


0

Có một vài lỗi ngôn ngữ nhỏ đang tạo ra một chút nhầm lẫn liên quan đến câu hỏi của bạn.

Nhưng tại sao chúng ta nên lý luận theo cách này? Mỗi quyết định, trên thực tế, có một phân phối tiện ích liên quan đến nó. Tại sao chúng ta so sánh sự phân phối của các tiện ích cho các lựa chọn khác nhau chỉ bằng một thống kê tóm tắt duy nhất? Và tại sao chúng ta chọn giá trị trung bình thay vì chế độ hoặc trung vị, v.v.?

Các tiện ích không có phân phối. Kết quả có một phân phối và thông qua kết quả, hành động, trong một số trường hợp, có một phân phối. Tiện ích mang tính quyết định. Nếu đó là ngẫu nhiên, thì cảm xúc của bạn về một kết quả sẽ liên tục làm bạn giật mình. Ví dụ, bạn có thể có trải nghiệm "wow, có đôi chân của tôi bị nghiền nát trong một tai nạn xe máy là một trải nghiệm tốt đáng ngạc nhiên!" Điều không chắc chắn là kết quả từ một hành động.

Nếu chúng tôi loại trừ các trường hợp suy biến, trong đó các tích phân phân kỳ và một giải pháp không tồn tại, tôi nghĩ tôi cũng có thể chỉ cho bạn một trường hợp trong đó trung vị tối đa hóa tiện ích mong đợi.

Lưu ý rằng U(δ(x),μ)=L(δ(x),μ). Chúng tôi thấy điều quan trọng là tạo quy tắc, đó là những gì chúng tôi đang đánh giá với tiện ích của chúng tôi, sẽ tìm thấyμ với sự nhất quán

Chúng tôi muốn giải quyết:

minδL(δ,μ)=|δ(x)μ|
chủ đề cho
f(x|μ)=1π11+(xμ)2.

Nếu chúng tôi giả sử rằng thì rủi ro làPr(μ)1,

|δ(x)μ|i=1n1π11+(xiμ)2dx

và rủi ro tích hợp giảm thiểu khi ở mức tối thiểu. Nó giảm thiểu khi là trung vị.

|δ(x)μ|i=1n1π11+(xiμ)2dxdμ
δ(x)

Bạn tối đa hóa tiện ích mong đợi khi bạn tìm thấy trung vị của dữ liệu. Bạn không thể tìm thấy giá trị trung bình cho vì nó không tồn tại. Bởi vì nó không có nghĩa, nó cũng không có phương sai. Vì nó không có phương sai, bạn không thể giảm thiểu tổn thất bậc hai. Do đó, tiện ích bậc hai, nếu đó là trường hợp thực, sẽ được giảm thiểu bởi bất kỳ giá trị nào trong các số thực.

f(x|μ)=1π11+(xμ)2,

Nếu bạn bỏ qua các trường hợp suy biến, như trường hợp trên, tiện ích dự kiến ​​có một lợi thế bất ngờ so với các phương pháp khác. Xem xét tất cả các quy tắc và hành động quyết định có thể được thực hiện, khi bạn sử dụng tiện ích dự kiến, sau đó bạn kết thúc với tổng số đơn đặt hàng. Bạn đúng, có thể có mối quan hệ, nhưng vì ảnh hưởng của tất cả các tham số đã được tính đến, bạn sẽ thờ ơ giữa các lựa chọn với tiện ích gắn liền.

Phương án thay thế, được sử dụng trong lý thuyết quyết định thường xuyên, là ra lệnh cho hàm rủi ro thông qua sự thống trị ngẫu nhiên. Một quyết định thường xuyên được cho là có thể được chấp nhận nếu nó không thể bị chi phối một cách ngẫu nhiên. Điều này không cho phép tổng số đơn đặt hàng. Tuy nhiên, nếu đơn hàng đầu tiên thống trị một cách ngẫu nhiên , thì cũng đúng là tiện ích dự kiến ​​của việc chọn . Vì vậy, sự thay thế mang lại cho bạn kết quả tương tự.δ(x)δ(x)δ>δ

Có một vài giải pháp khác có thể được sử dụng, nhưng chúng có thể ánh xạ để tối đa hóa tiện ích dự kiến hoặc chúng đặt ra câu hỏi tại sao bạn sẽ sử dụng chúng trong trường hợp chúng không sử dụng. Để đưa ra một ví dụ thống kê khác, hãy tưởng tượng bạn đọc một nghiên cứu có kích thước mẫu là một triệu quan sát bằng các phương pháp khả năng tối đa hoặc phương pháp Bayes. Bạn sao chép nghiên cứu với cỡ mẫu là 100 và ước tính giá trị trung bình và phương sai bằng công cụ ước lượng không thiên vị. Cả Bayesian và ước tính khả năng tối đa đều không thiên vị trong trường hợp chung.

Bạn khẳng định rằng bạn sẽ không kết hợp các ước tính của mình vì ước tính khác bị sai lệch, trong khi ước tính của bạn không thiên vị. Các phương pháp Bayes cung cấp một phương pháp có kỷ luật để kết hợp các mẫu vào một công cụ ước tính điểm duy nhất tối đa hóa tiện ích của bạn. Bạn khăng khăng mất thông tin trong mẫu một triệu người ủng hộ sự không thiên vị.

Bây giờ, nếu tiện ích của bạn có xu hướng rất mạnh đối với các công cụ ước tính không thiên vị, thì bạn sẽ tối đa hóa tiện ích của mình bằng cách không tối đa hóa tiện ích của công cụ ước tính. Nhưng trong trường hợp không có điều đó, công cụ ước tính sai lệch sẽ chính xác hơn nhiều so với chỉ từ mẫu nhỏ của bạn. Nếu độ chính xác tối đa hóa tiện ích của bạn, thì cuối cùng bạn chọn một công cụ ước tính là tối đa hóa tiện ích.

Đừng nhầm lẫn giữa sự mong đợi của tiện ích với giá trị mong đợi của hành động. Đó là những điều khác nhau.

Ngoài ra, hãy xem xét tối đa hóa tiện ích dự kiến ​​so với tiện ích trung bình. Bạn lấy tiện ích của mọi kết quả nhân với xác suất của nó và tính tổng.

E[U(x~)]=x~χU(x~)Pr(x~)dx~

Bây giờ hãy nghĩ về tiện ích trung bình.

M[U(x~)]=c
nếu
acU(x~)Pr(x~)dx~=cbU(x~)Pr(x~)dx~.

Điều đó có nghĩa là gì? Bạn sẽ rất vui nếu bạn hạ cánh sang trái khi bạn hạ cánh sang phảic? Tại sao bạn lại quan tâm đến điều đó?

Nếu bạn chọn một hành động tối đa hóa tiện ích mong đợi, thì không có hành động nào bạn có thể thực hiện mà bạn tin rằng sẽ khiến bạn hạnh phúc hơn. Tiện ích trung bình không cho phép tối đa hóa vì hành động được chọn bởi lực lượng ở trung tâm. Bạn sẽ luôn thực hiện hành động mang lại cho bạn cơ hội hạnh phúc hơn năm mươi phần trăm so với bình thường hoặc buồn hơn bình thường. Thật là một điều kỳ lạ để làm!

EDIT Từ các tiên đề của Kolmogorov, tổng phân phối phải bằng một. Hãy xem xét một trường hợp có hai bộ hành động,aa, Ở đâu a là tập hợp các hành động không a.

Tập trung vào a, chúng ta hãy giả sử rằng chức năng tiện ích là x2. Chúng ta hãy giả định rằngx, khi hành động là a, được rút ra từ f(x)=exp(x),x>0.

Ghi chú điều đó

0exp(x)dx=1,
chúng ta có thể dễ dàng xác nhận rằng đó là một hàm mật độ xác suất. Bao gồm các kết quả tiện ích trong
0x2exp(x)dx=2,
trong đó xác nhận nó không phải là một bản phân phối.
E(U(a))=2.

Mặc dù có thể tạo ra phân phối bởi các tiện ích, nhưng nó không nhất thiết phải là một chức năng kể từ khi g(x)=U(x)Pr(x), sau đó g1(x) không được đảm bảo là một chức năng.


Tiện ích tất nhiên có phân phối!? Tôi không biết bạn đang nói về điều gì
innisfree

À, được rồi Tiện ích của một kết quả chắc chắn cụ thểA, U(A), thực sự là "quyết định". Kết quả mặc dù là một tiên nghiệm chưa biết, vì vậy kể từ kết quảOsome distribution, chúng tôi cũng có một bản phân phối của một tiên nghiệm chưa biết U(O).
innisfree
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.