Có một vài lỗi ngôn ngữ nhỏ đang tạo ra một chút nhầm lẫn liên quan đến câu hỏi của bạn.
Nhưng tại sao chúng ta nên lý luận theo cách này? Mỗi quyết định, trên thực tế, có một phân phối tiện ích liên quan đến nó. Tại sao chúng ta so sánh sự phân phối của các tiện ích cho các lựa chọn khác nhau chỉ bằng một thống kê tóm tắt duy nhất? Và tại sao chúng ta chọn giá trị trung bình thay vì chế độ hoặc trung vị, v.v.?
Các tiện ích không có phân phối. Kết quả có một phân phối và thông qua kết quả, hành động, trong một số trường hợp, có một phân phối. Tiện ích mang tính quyết định. Nếu đó là ngẫu nhiên, thì cảm xúc của bạn về một kết quả sẽ liên tục làm bạn giật mình. Ví dụ, bạn có thể có trải nghiệm "wow, có đôi chân của tôi bị nghiền nát trong một tai nạn xe máy là một trải nghiệm tốt đáng ngạc nhiên!" Điều không chắc chắn là kết quả từ một hành động.
Nếu chúng tôi loại trừ các trường hợp suy biến, trong đó các tích phân phân kỳ và một giải pháp không tồn tại, tôi nghĩ tôi cũng có thể chỉ cho bạn một trường hợp trong đó trung vị tối đa hóa tiện ích mong đợi.
Lưu ý rằng U(δ(x),μ)=−L(δ(x),μ). Chúng tôi thấy điều quan trọng là tạo quy tắc, đó là những gì chúng tôi đang đánh giá với tiện ích của chúng tôi, sẽ tìm thấyμ với sự nhất quán
Chúng tôi muốn giải quyết: minδL(δ,μ)=|δ(x)−μ|
chủ đề chof(x|μ)=1π11+(x−μ)2.
Nếu chúng tôi giả sử rằng thì rủi ro làPr(μ)∝1,∫∞−∞|δ(x)−μ|∏i=1n1π11+(xi−μ)2dx
và rủi ro tích hợp giảm thiểu khi ở mức tối thiểu. Nó giảm thiểu khi là trung vị.∫∞−∞∫∞−∞|δ(x)−μ|∏i=1n1π11+(xi−μ)2dxdμ
δ(x)
Bạn tối đa hóa tiện ích mong đợi khi bạn tìm thấy trung vị của dữ liệu. Bạn không thể tìm thấy giá trị trung bình cho vì nó không tồn tại. Bởi vì nó không có nghĩa, nó cũng không có phương sai. Vì nó không có phương sai, bạn không thể giảm thiểu tổn thất bậc hai. Do đó, tiện ích bậc hai, nếu đó là trường hợp thực, sẽ được giảm thiểu bởi bất kỳ giá trị nào trong các số thực.f(x|μ)=1π11+(x−μ)2,
Nếu bạn bỏ qua các trường hợp suy biến, như trường hợp trên, tiện ích dự kiến có một lợi thế bất ngờ so với các phương pháp khác. Xem xét tất cả các quy tắc và hành động quyết định có thể được thực hiện, khi bạn sử dụng tiện ích dự kiến, sau đó bạn kết thúc với tổng số đơn đặt hàng. Bạn đúng, có thể có mối quan hệ, nhưng vì ảnh hưởng của tất cả các tham số đã được tính đến, bạn sẽ thờ ơ giữa các lựa chọn với tiện ích gắn liền.
Phương án thay thế, được sử dụng trong lý thuyết quyết định thường xuyên, là ra lệnh cho hàm rủi ro thông qua sự thống trị ngẫu nhiên. Một quyết định thường xuyên được cho là có thể được chấp nhận nếu nó không thể bị chi phối một cách ngẫu nhiên. Điều này không cho phép tổng số đơn đặt hàng. Tuy nhiên, nếu đơn hàng đầu tiên thống trị một cách ngẫu nhiên , thì cũng đúng là tiện ích dự kiến của việc chọn . Vì vậy, sự thay thế mang lại cho bạn kết quả tương tự.δ(x)δ′(x)δ>δ′
Có một vài giải pháp khác có thể được sử dụng, nhưng chúng có thể ánh xạ để tối đa hóa tiện ích dự kiến hoặc chúng đặt ra câu hỏi tại sao bạn sẽ sử dụng chúng trong trường hợp chúng không sử dụng. Để đưa ra một ví dụ thống kê khác, hãy tưởng tượng bạn đọc một nghiên cứu có kích thước mẫu là một triệu quan sát bằng các phương pháp khả năng tối đa hoặc phương pháp Bayes. Bạn sao chép nghiên cứu với cỡ mẫu là 100 và ước tính giá trị trung bình và phương sai bằng công cụ ước lượng không thiên vị. Cả Bayesian và ước tính khả năng tối đa đều không thiên vị trong trường hợp chung.
Bạn khẳng định rằng bạn sẽ không kết hợp các ước tính của mình vì ước tính khác bị sai lệch, trong khi ước tính của bạn không thiên vị. Các phương pháp Bayes cung cấp một phương pháp có kỷ luật để kết hợp các mẫu vào một công cụ ước tính điểm duy nhất tối đa hóa tiện ích của bạn. Bạn khăng khăng mất thông tin trong mẫu một triệu người ủng hộ sự không thiên vị.
Bây giờ, nếu tiện ích của bạn có xu hướng rất mạnh đối với các công cụ ước tính không thiên vị, thì bạn sẽ tối đa hóa tiện ích của mình bằng cách không tối đa hóa tiện ích của công cụ ước tính. Nhưng trong trường hợp không có điều đó, công cụ ước tính sai lệch sẽ chính xác hơn nhiều so với chỉ từ mẫu nhỏ của bạn. Nếu độ chính xác tối đa hóa tiện ích của bạn, thì cuối cùng bạn chọn một công cụ ước tính là tối đa hóa tiện ích.
Đừng nhầm lẫn giữa sự mong đợi của tiện ích với giá trị mong đợi của hành động. Đó là những điều khác nhau.
Ngoài ra, hãy xem xét tối đa hóa tiện ích dự kiến so với tiện ích trung bình. Bạn lấy tiện ích của mọi kết quả nhân với xác suất của nó và tính tổng. E[U(x~)]=∫x~∈χU(x~)Pr(x~)dx~
Bây giờ hãy nghĩ về tiện ích trung bình.M[U(x~)]=c
nếu ∫caU(x~)Pr(x~)dx~=∫bcU(x~)Pr(x~)dx~.
Điều đó có nghĩa là gì? Bạn sẽ rất vui nếu bạn hạ cánh sang trái khi bạn hạ cánh sang phảic? Tại sao bạn lại quan tâm đến điều đó?
Nếu bạn chọn một hành động tối đa hóa tiện ích mong đợi, thì không có hành động nào bạn có thể thực hiện mà bạn tin rằng sẽ khiến bạn hạnh phúc hơn. Tiện ích trung bình không cho phép tối đa hóa vì hành động được chọn bởi lực lượng ở trung tâm. Bạn sẽ luôn thực hiện hành động mang lại cho bạn cơ hội hạnh phúc hơn năm mươi phần trăm so với bình thường hoặc buồn hơn bình thường. Thật là một điều kỳ lạ để làm!
EDIT
Từ các tiên đề của Kolmogorov, tổng phân phối phải bằng một. Hãy xem xét một trường hợp có hai bộ hành động,a và a′, Ở đâu a′ là tập hợp các hành động không a.
Tập trung vào a, chúng ta hãy giả sử rằng chức năng tiện ích là −x2. Chúng ta hãy giả định rằngx, khi hành động là a, được rút ra từ f(x)=exp(−x),x>0.
Ghi chú điều đó ∫∞0exp(−x)dx=1,
chúng ta có thể dễ dàng xác nhận rằng đó là một hàm mật độ xác suất. Bao gồm các kết quả tiện ích trong∫∞0x2exp(−x)dx=−2,
trong đó xác nhận nó không phải là một bản phân phối. E(U(a))=−2.
Mặc dù có thể tạo ra phân phối bởi các tiện ích, nhưng nó không nhất thiết phải là một chức năng kể từ khi g(x)=U(x)Pr(x), sau đó g−1(x) không được đảm bảo là một chức năng.