Công cụ ước tính James-Stein với phương sai không bằng nhau


11

Mỗi tuyên bố tôi tìm thấy về công cụ ước tính James-Stein đều cho rằng các biến ngẫu nhiên được ước tính có cùng phương sai (và đơn vị).

Nhưng tất cả các ví dụ này cũng đề cập rằng công cụ ước tính JS có thể được sử dụng để ước tính số lượng không liên quan gì đến nhau. Các ví dụ wikipedia là tốc độ ánh sáng tiêu thụ, trà tại Đài Loan, và trọng lượng heo ở Montana. Nhưng có lẽ các phép đo của bạn trên ba đại lượng này sẽ có phương sai "thật" khác nhau. Điều này có vấn đề?

Mối quan hệ này thành một vấn đề khái niệm lớn hơn mà tôi không hiểu, liên quan đến câu hỏi này: James-Stein ước: Làm thế nào đã làm Efron và Morris tính toán trong yếu tố co rút ví dụ bóng chày của họ? σ2 cChúng tôi tính toán hệ số hao hụt như sau:c

c=1(k3)σ2(yy¯)2

Theo trực giác, tôi sẽ nghĩ rằng thuật ngữ thực sự là - khác nhau cho mỗi số lượng được ước tính. Nhưng cuộc thảo luận trong câu hỏi đó chỉ nói về việc sử dụng phương sai gộp ...σ 2 iσ2σi2

Tôi thực sự sẽ đánh giá cao nếu bất cứ ai có thể làm sáng tỏ sự nhầm lẫn này!


3
Nếu phương sai là chúng ta có thể nhân bội cho để quay lại vấn đề James-Stein. Nếu không xác định, nhưng mỗi "quan sát" trong bài toán là một giá trị trung bình mẫu được tính toán trên cơ sở các quan sát chúng ta có thể ước tính với một số và hy vọng rằng chúng ta cũng có được tình huống James-Stein nếu chúng ta nhân trước thay vào đó. D - 1 / 2 D m i D D D - 1 / 2D=diag(σ12,,σn2)D1/2DmiDD^D^1/2
anh chàng

2
@guy: đây là một gợi ý hợp lý (+1), tuy nhiên điều này sẽ dẫn đến cùng một hệ số co rút cho tất cả các biến, trong khi người ta muốn thu nhỏ các biến khác nhau, tùy thuộc vào phương sai / độ không đảm bảo của chúng. Xem câu trả lời mà tôi vừa đăng.
amip nói rằng Phục hồi lại

1
@amoeba Chắc chắn rồi; Tôi không cho rằng công cụ ước tính của tôi là thực tế, chỉ có điều nó minh họa tại sao mọi người nói những điều OP đề cập trong đoạn thứ hai của anh ấy / cô ấy.
anh chàng

Câu trả lời:


6

Câu hỏi này đã được trả lời rõ ràng trong loạt bài viết cổ điển về công cụ ước tính James-Stein trong bối cảnh Empirical Bayes được viết vào những năm 1970 bởi Efron & Morris. Tôi chủ yếu đề cập đến:

  1. Efron và Morris, 1973, Quy tắc ước tính của Stein và các đối thủ cạnh tranh của nó - Phương pháp tiếp cận thực nghiệm Bayes

  2. Efron và Morris, 1975, Phân tích dữ liệu với Công cụ ước tính của Stein và các khái quát của nó

  3. Efron và Morris, 1977, Nghịch lý của Stein về thống kê

c

Tuy nhiên, họ tiến hành đưa ra một ví dụ khác, đó là ước tính tỷ lệ nhiễm toxoplasmosis ở một số thành phố ở El Salvador. Ở mỗi thành phố, số lượng người khác nhau được khảo sát và do đó, các quan sát riêng lẻ (tỷ lệ nhiễm toxoplasmosis ở mỗi thành phố) có thể được coi là có phương sai khác nhau (số người được khảo sát càng thấp, phương sai càng cao). Trực giác chắc chắn là các điểm dữ liệu có phương sai thấp (độ không đảm bảo thấp) không cần phải được thu hẹp mạnh như các điểm dữ liệu có phương sai cao (độ không đảm bảo cao). Kết quả phân tích của họ được hiển thị trên hình dưới đây, nơi điều này thực sự có thể được nhìn thấy đang xảy ra:

nhập mô tả hình ảnh ở đây

Dữ liệu và phân tích tương tự cũng được trình bày trong bài báo kỹ thuật năm 1975 nhiều hơn, trong một hình thanh lịch hơn nhiều (tiếc là không hiển thị các phương sai riêng lẻ), xem Phần 3:

nhập mô tả hình ảnh ở đây

Xi|θiN(θi,Di)θiN(0,A)
ADi=11/(1+A)(k2)/Xj2θi
θ^i=(111+A)Xi=(1k2Xj2)Xi,

Di1

θ^i=(1DiDi+A)Xi
AA^

DjA^ik

Phần có liên quan trong bài viết năm 1973 là Phần 8, và nó hơi khó đọc hơn. Thật thú vị, họ có một nhận xét rõ ràng ở đó về đề xuất của @guy trong các bình luận ở trên:

x~i=Di1/2xi,θ~i=Di1/2θix~iN(θ~i,1)θi

θ^i=(1k2[Xj2/Dj])Xi.
Xi

A^i

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.