Một lời giải thích trực quan tại sao thủ tục FDR của Stewamini-Hochberg hoạt động?


14

Có một cách đơn giản để giải thích lý do tại sao quy trình của Stewamini và Hochberg (1995) thực sự kiểm soát tỷ lệ phát hiện sai (FDR)? Thủ tục này rất thanh lịch và nhỏ gọn và bằng chứng về lý do tại sao nó hoạt động dưới sự độc lập (xuất hiện trong phần phụ lục của bài báo năm 1995 của họ ) không dễ tiếp cận.


4
theo tôi, bằng chứng về kiểm soát FDR được trình bày ở đây trực quan hơn (lưu ý bạn đang tìm bằng chứng của định lý 2): citeseerx.ist.psu.edu/viewdoc/. Ở đó, lập luận chỉ dựa vào việc nhận thấy rằng chúng tôi có thể sử dụng định lý dừng tùy chọn.
user795305

3
Có một bài giảng hay từ Stewamini trên YouTube về vấn đề so sánh nhiều, và lịch sử và sự phát triển logic của các phương pháp điều chỉnh được sử dụng để giải quyết nó.
Alexis

Ramdas et al. (2017) là một bài báo gần đây rất hay, thống nhất và khái quát nhiều phương pháp thử nghiệm, và Dự luật 1 (c) của chúng ngụ ý Định lý 1 trong Stewamini & Hochberg (1995). Bằng chứng chỉ áp dụng Bổ đề 1 (c) để ràng buộc kỳ vọng của FDP, và chính Bổ đề này chỉ được chứng minh bằng phép tính đa biến rất cơ bản trong phụ lục của chúng.
daniel.s

2
Đây là một lời giải thích trực quan khác mà tôi đã tìm thấy trên kênh của StatQuest trên YouTube: youtube.com/watch?v=K8LQSvtjcEo
RobertF

Câu trả lời:


2

Đây là một số Rmã để tạo ra một hình ảnh. Nó sẽ hiển thị 15 giá trị p mô phỏng được vẽ theo thứ tự của chúng. Vì vậy, chúng tạo thành một mô hình điểm tăng dần. Các điểm bên dưới các đường màu đỏ / tím đại diện cho các thử nghiệm quan trọng ở mức 0,1 hoặc 0,2. FDR là số điểm đen bên dưới đường chia cho tổng số điểm bên dưới đường.

x0 <- runif(10)      #p-values of 10 true null hypotheses. They are Unif[0,1] distributed.
x1 <- rbeta(5,2,30)  # 5 false hypotheses, rather small p-values
xx <- c(x1,x0)
plot(sort(xx))
a0 <- sort(xx)
for (i in 1:length(x0)){a0[a0==x0[i]] <- NA}
points(a0,col="red")
points(c(1,15), c(1/15 * 0.1 ,0.1), type="l", col="red")
points(c(1,15), c(1/15 * 0.2 ,0.2), type="l", col="purple")

Tôi hy vọng điều này có thể mang lại một số cảm giác về hình dạng phân phối các giá trị p có thứ tự. Rằng các dòng là chính xác và không phải là một số đường cong hình ngụ ngôn, phải làm với hình dạng của các phân phối thứ tự. Điều này phải được tính toán rõ ràng. Trong thực tế, dòng chỉ là một giải pháp bảo thủ.


1
Bạn có phiền khi thêm set.seed(<some number>)và đăng con số kết quả cho những người không đọc R không?
gung - Phục hồi Monica

Không có điểm nào nằm dưới dòng khi tôi chạy mã này ...
winni2k
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.