Công cụ ước tính Bayes miễn nhiễm với lựa chọn Xu hướng


11

Là người ước tính Bayes miễn dịch với sự lựa chọn thiên vị?

Hầu hết các bài báo thảo luận về ước tính ở chiều cao, ví dụ, toàn bộ dữ liệu trình tự bộ gen, thường sẽ đưa ra vấn đề sai lệch lựa chọn. Lựa chọn thiên vị xuất phát từ thực tế rằng, mặc dù chúng ta có hàng ngàn người dự đoán tiềm năng sẽ chỉ có một vài người được chọn và suy luận được thực hiện trên số ít người được chọn. Vì vậy, quá trình này diễn ra theo hai bước: (1) chọn một tập hợp con của các yếu tố dự đoán (2) thực hiện suy luận trên các tập hợp được chọn, ví dụ: ước tính tỷ lệ chênh lệch. Dawid trong bài báo nghịch lý năm 1994 của ông tập trung vào các công cụ ước tính không thiên vị và công cụ ước tính Bayes. Ông đơn giản hóa vấn đề để chọn hiệu ứng lớn nhất, có thể là hiệu quả điều trị. Sau đó, ông nói, các công cụ ước tính không thiên vị bị ảnh hưởng bởi sai lệch lựa chọn. Ông đã sử dụng ví dụ: giả sử sau đó mỗi

ZiN(δi,1),i=1,,N
Zi không thiên vị cho . Hãy , các ước lượng tuy nhiên được thiên vị ( tích cực) cho \ max \ {\ delta_1, \ delta_2, \ ldots, \ delta_N \} . Tuyên bố này có thể dễ dàng được chứng minh với sự bất bình đẳng của Jensen. Do đó, nếu chúng tôi biết i _ {\ max} , chỉ mục của \ delta_i lớn nhất , chúng tôi sẽ chỉ sử dụng Z_ {i _ {\ max}} làm công cụ ước tính không thiên vị. Nhưng vì chúng tôi không biết điều này, chúng tôi sử dụng \ gamma_1 (\ mathbf {Z}) thay vào đó sẽ bị sai lệch (tích cực).δiZ=(Z1,Z2,,ZN)T
γ1(Z)=max{Z1,Z2,,ZN}
max{δ1,δ2,,δN}imaxδiZimaxγ1(Z)

nhập mô tả hình ảnh ở đây

Nhưng tuyên bố đáng lo ngại mà Dawid, Efron và các tác giả khác đưa ra là những người ước tính Bayes miễn nhiễm với sự lựa chọn sai lệch. Nếu bây giờ tôi sẽ đặt trước , giả sử , Thì công cụ ước tính Bayes của được đưa ra bởi trong đó , với là Gaussian tiêu chuẩn.δiδig(.)δi

E{δiZi}=zi+ddzim(zi)
m(zi)=φ(ziδi)g(δi)dδiφ(.)

Nếu chúng tôi xác định công cụ ước tính mới của là bất cứ điều gì chọn để ước tính với , sẽ giống nếu lựa chọn dựa trên . Điều này diễn ra bởi vì là đơn điệu trong . Chúng tôi cũng biết rằng thu về 0 với thuật ngữ,δimax

γ2(Z)=max{E{δ1Z1},E{δ2Z2},,E{δNZN}},
iδimaxγ1(Z)iγ2(Z)γ2(Z)ZiE{δiZi}Ziddzim(zi)làm giảm một số sai lệch tích cực trong . Nhưng làm thế nào để chúng tôi kết luận rằng những người ước tính Bayes miễn nhiễm với sự lựa chọn sai lệch. Tôi thực sự không nhận được nó.Zi

1
Cho rằng bạn đang đề cập đến một yêu cầu trong một tác phẩm văn học, bạn có thể vui lòng đưa ra một tình huống và tham khảo trang đầy đủ, để chúng tôi có thể đọc toàn bộ bối cảnh của yêu cầu này.
Ben - Phục hồi Monica

Là xác định một công cụ ước tính là tối đa của các công cụ ước tính Bayes vẫn là một công cụ ước tính Bayes?
Tây An

Ví dụ 1 trong bài báo.
Chamberlain Foncha

Câu trả lời:


4

Như đã mô tả ở trên, vấn đề liên quan đến việc suy luận về chỉ số và giá trị, (i⁰, μ⁰), giá trị trung bình lớn nhất của một mẫu rvs Bình thường. Điều tôi cảm thấy ngạc nhiên trong bài thuyết trình của Dawid là phân tích Bayes không có vẻ nhiều Bayes. Nếu được cung cấp toàn bộ mẫu, cách tiếp cận Bayes sẽ tạo ra phân phối sau trên (i⁰,), thay vì làm theo các bước ước tính, từ ước tính i⁰ đến ước tính giá trị trung bình liên quan. Và nếu cần, các công cụ ước tính nên xuất phát từ định nghĩa của hàm mất cụ thể. Thay vào đó, khi, đưa ra điểm lớn nhất trong mẫu và chỉ điểm đó, phân phối của nó thay đổi, vì vậy tôi khá bối rối bởi tuyên bố rằng không cần điều chỉnh.

Mô hình trước đó cũng khá đáng ngạc nhiên khi các linh mục về phương tiện phải là khớp chứ không phải là sản phẩm của Normals độc lập, vì các phương tiện này được so sánh và do đó có thể so sánh được. Ví dụ, một thứ bậc trước có vẻ phù hợp hơn, với vị trí và tỷ lệ được ước tính từ toàn bộ dữ liệu. Tạo một kết nối giữa các phương tiện ... Một sự phản đối có liên quan đến việc sử dụng các linh mục không phù hợp độc lập là giá trị trung bình tối đa μ⁰ sau đó không có một biện pháp được xác định rõ. Tuy nhiên, tôi không nghĩ rằng một lời chỉ trích của một số linh mục so với người khác là một cuộc tấn công có liên quan đến "nghịch lý" này.


1
Dường như với tôi rằng tất cả các bảo vệ cần thiết phải được mã hóa trước đó kết nối tất cả các phương tiện chưa biết. Nếu sự ưu tiên tạo ra sự khác biệt lớn giữa các phương tiện rất khó xảy ra, điều đó sẽ được phản ánh ở phía sau làm cho nó trở nên hoàn hảo.
Frank Harrell

@ Xi'an bạn có thể đưa ra một ví dụ về cách bạn sẽ đặt trước không? (i,μ)
Chamberlain Foncha

@Frank Harrel, hãy xem xét ví dụ và . Công cụ ước tính không thiên vị của là . Công cụ ước tính Bayes của là . Nếu là lớn nhất thì , vì công cụ ước tính Bayes là đơn điệu trong . Cho dù thông tin trước có thông tin như thế nào, điều này sẽ không thay đổi. Tuy nhiên, làm giảm các Bayes dương trong . Nhưng nếu chọn sai công cụ ước tính Bayes không thể sửa lỗi này.δiN(a,1)ZiN(δi,1)δiZiδiE(δi|Zi)Zi0ZiE(δi0|Zi0)ZiE(δi0|Zi0)Zi0i0
Chamberlain Foncha

@ChamberlainFoncha: Công cụ ước tính Bayes chỉ là khi là độc lập tiên nghiệm. Một mối nối trước và khiến họ thực sự phụ thuộc. E[δi|Zi]δiiμi
Tây An

Và mọi ưu tiên đều được chấp nhận theo quan điểm của Bayes, ví dụ: phân phối đồng đều trên chỉ mục và phân cấp trước trên 's. μi
Tây An

1

Ngay cả khi một chút phản trực giác, tuyên bố là chính xác. Giả sử cho thử nghiệm này, thì hậu thế cho thực sự là . Thực tế phản trực giác này hơi giống với việc Bayes miễn nhiễm với việc dừng lại (bí mật) sớm (điều đó cũng rất phản trực giác).i=5μ5N(x5,σ2)

Lý luận Bayes sẽ dẫn đến kết luận sai nếu cho mỗi thí nghiệm như vậy (hãy tưởng tượng bạn lặp lại nó một vài lần), chỉ những kết quả cho giống tốt nhất sẽ được giữ lại. Sẽ có lựa chọn dữ liệu và phương pháp Bayes rõ ràng không tránh khỏi lựa chọn dữ liệu (bí mật). Trên thực tế không có phương pháp thống kê nào miễn nhiễm với lựa chọn dữ liệu.

Nếu lựa chọn như vậy được thực hiện, một lý do Bayes hoàn chỉnh có tính đến lựa chọn này sẽ dễ dàng điều chỉnh ảo ảnh.

Tuy nhiên, câu "Công cụ ước tính Bayes miễn nhiễm với lựa chọn Xu hướng" là một chút nguy hiểm. Thật dễ dàng để tưởng tượng các tình huống trong đó "lựa chọn" có nghĩa là một cái gì đó khác, chẳng hạn như lựa chọn các biến giải thích hoặc lựa chọn dữ liệu. Bayes không rõ ràng miễn dịch với điều này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.