[Đây là một đoạn trích từ sách giáo khoa của riêng tôi, The Bayesian Choice (2007) , lập luận ủng hộ cách tiếp cận lý thuyết quyết định đối với phân tích Bayes, do đó sử dụng rủi ro Bayes.]
Ngoại trừ các cài đặt tầm thường nhất, nhìn chung không thể tối thiểu hóa (trong ) chức năng mất khi không biết . Để có được một tiêu chí so sánh hiệu quả từ hàm mất mát, phương pháp thường xuyên đề xuất xem xét thay vì tổn thất trung bình (hoặc rủi ro thường xuyên )
trong đó là quy tắc quyết định, nghĩa là phân bổ quyết định cho từng kết quảdL(θ,d)θ
R(θ,δ)==Eθ[L(θ,δ(x))]∫XL(θ,δ(x))f(x|θ)dx,
δ(x)x∼f(x|θ) từ thí nghiệm ngẫu nhiên.
Hàm , từ trong , thường được gọi là công cụ ước tính (trong khi giá trị được gọi là ước tính của ). Khi không có nguy cơ nhầm lẫn, chúng tôi cũng biểu thị tập hợp các công cụ ước tính bằng .δXDδ(x)θD
Các mô hình frequentist dựa vào tiêu chí này để so sánh ước lượng và, nếu có thể, để chọn ước lượng tốt nhất, lập luận được rằng ước lượng được đánh giá về hoạt động dài hạn của họ cho tất cả các giá trị có thể của tham số . Tuy nhiên, lưu ý rằng có một số khó khăn liên quan đến phương pháp này.θ
- Lỗi (mất) được tính trung bình trên các giá trị khác nhau của
tỷ lệ với mật độ . Do đó, dường như quan sát không được tính đến nữa. Tiêu chí rủi ro đánh giá các quy trình về hiệu suất dài hạn của họ và không trực tiếp cho quan sát đã cho, . Một đánh giá như vậy có thể là thỏa đáng cho nhà thống kê, nhưng nó không hấp dẫn đối với một khách hàng, những người muốn có kết quả tối ưu cho dữ liệu của mình , chứ không phải của người khác!xf(x|θ)xxx
- Việc phân tích thường xuyên về vấn đề quyết định mặc nhiên cho rằng vấn đề này sẽ được đáp ứng nhiều lần, để đánh giá tần số có ý nghĩa. Thật vậy, xấp xỉ tổn thất trung bình so với các lần lặp lại của cùng một thí nghiệm, theo Luật Số lớn. Tuy nhiên, trên cả cơ sở triết học và thực tiễn, có rất nhiều tranh cãi về khái niệm lặp lại của các thí nghiệm (xem Jeffreys (1961)). Đối với một điều, nếu các quan sát mới đến nhà thống kê, cô ấy nên sử dụng chúng, và điều này có thể sửa đổi cách thức thí nghiệm được tiến hành, ví dụ như, trong các thử nghiệm y tế.R(θ,δ)
- Đối với thủ tục , rủi ro là một hàm của tham số . Do đó, cách tiếp cận thường xuyên không tạo ra tổng thứ tự trên bộ thủ tục. Nhìn chung, không thể so sánh các thủ tục quyết định với tiêu chí này, vì hai hàm rủi ro chéo ngăn cản so sánh giữa các ước tính tương ứng. Tốt nhất, người ta có thể hy vọng một thủ tục giảm thiểu đồng đều , nhưng những trường hợp như vậy hiếm khi xảy ra trừ khi không gian của thủ tục quyết định bị hạn chế. Các thủ tục tốt nhất chỉ có thể đạt được bằng cách hạn chế một cách giả tạo tập hợp các thủ tục được ủy quyền.δR(θ,δ)θδ0R(θ,δ)
Ví dụ 2.4 - Xem xét và , hai quan sát từ
Tham số quan tâm là (nghĩa là ) và nó được ước tính bởi các công cụ ước tính theo tổn thất
thường được gọi là lỗ , mà phạt lỗi dự toán, bất kể tầm quan trọng của họ, bởi . Xem xét cụ thể \ est
chức năng rủi ro của nó là
x1x2
Pθ(x=θ−1)=Pθ(x=θ+1)=0.5,θ∈R.
θD=ΘδL(θ,δ)=1−Iθ(δ),
0−1 1δ0(x1,x2)=x1+x22,
R(θ,δ0)==1−Pθ(δ0(x1,x2)=θ)1−Pθ(x1≠x2)=0.5.
Tính toán này cho thấy công cụ ước tính đúng một nửa thời gian. Trên thực tế, công cụ ước tính này luôn luôn đúng khi
và luôn luôn sai. Bây giờ, \ est \
cũng có hàm rủi ro bằng , cũng như . Do đó, ,
và không thể được xếp hạng dưới mức .
δ0x1≠x2δ1(x1,x2)=x1+10.5δ2(x1,x2)=x2−1δ0δ1δ20−1▶
Ngược lại, cách tiếp cận Bayes đối với Lý thuyết quyết định tích hợp trên không gian vì không xác định, thay vì tích hợp vào không gian như biết. Nó phụ thuộc vào sự mất mát dự kiến sau
trung bình lỗi (nghĩa là mất) phân phối sau của tham số , có điều kiện trên giá trị quan sát} . Cho , sai số trung bình do quyết định thực sự làΘθXx
ρ(π,d|x)==Eπ[L(θ,d)|x]∫ΘL(θ,d)π(θ|x)dθ,
θxxdρ(π,d|x) . Do đó, tổn thất dự kiến là một hàm của nhưng sự phụ thuộc này không gây phiền hà, trái ngược với sự phụ thuộc thường xuyên của rủi ro vào tham số vì , trái với , được biết đến.
xxθ