Phương pháp tính điểm Z của Stouffer: nếu chúng ta tính


22

Tôi đang thực hiện kiểm tra thống kê độc lập với cùng một giả thuyết null và muốn kết hợp các kết quả thành một giá trị . Dường như có hai phương pháp "được chấp nhận": phương pháp của Fisher và phương pháp của Stouffer .Np

Câu hỏi của tôi là về phương pháp của Stouffer. Đối với mỗi bài kiểm tra riêng biệt, tôi nhận được một số điểm . Theo một giả thuyết, mỗi người trong số họ được phân phối với một phân phối chuẩn chuẩn, vì vậy số tiền sau một phân phối chuẩn với phương sai . Do đó, phương pháp của Stouffer đề nghị tính toán , thường được phân phối với phương sai đơn vị, và sau đó sử dụng phương thức này làm điểm số z chung.ztôiΣztôiNΣztôi/N

Điều này là hợp lý, nhưng đây là một cách tiếp cận khác mà tôi đã đưa ra và điều đó cũng có vẻ hợp lý với tôi. Vì mỗi đến từ một phân phối chuẩn thông thường, tổng bình phương nên đến từ phân phối chi bình phương với bậc tự do. Vì vậy, người ta có thể tính và chuyển đổi nó thành giá trị bằng cách sử dụng hàm phân phối chi bình phương tích lũy với bậc tự do ( , trong đó là CDF).ztôiS= =Σztôi2NSN p = 1 - X N ( S ) X NpNp= =1-XN(S)XN

Tuy nhiên, không nơi nào tôi có thể tìm thấy phương pháp này thậm chí được đề cập. Có bao giờ được sử dụng? Nó có tên không? Điều gì sẽ là lợi thế / bất lợi so với phương pháp của Stouffer? Hoặc có một lỗ hổng trong lý luận của tôi?


Một lỗ hổng nổi bật nhảy ra là phương pháp của Stouffer có thể phát hiện ra sự dịch chuyển có hệ thống trong , đó là điều người ta thường mong đợi sẽ xảy ra khi một phương án luôn đúng, trong khi phương pháp chi bình phương sẽ có ít năng lượng hơn để làm như vậy. Một mô phỏng nhanh ( , lần lặp) cho thấy đây là trường hợp; phương pháp chi bình phương thực sự kém mạnh mẽ để phát hiện phương án một phía. N = 100 10 4ziN=100104
whuber

2
Cảm ơn, whuber! Bạn có thể mô tả mô phỏng của bạn chi tiết hơn, tôi tò mò. Mặt khác, nếu có dấu hiệu khác nhau nhưng giá trị tuyệt đối lớn, sau đó phương pháp Stouffer có thể kết thúc với tổng , trong khi đó phương pháp của tôi sẽ báo cáo một RẤT quan trọng . Tôi đoán trong một số trường hợp nó có thể có ý nghĩa hơn nhiều (và tôi nghi ngờ trong trường hợp của tôi nó có, nhưng tôi không chắc chắn). z 0 pziz0p
amip nói rằng Phục hồi lại

1
Bạn nói đúng, đó là lý do tại sao tôi không đăng bình luận của mình như một câu trả lời. Nhưng có những loại tình huống nào xảy ra khi các lựa chọn thay thế hoàn toàn khác nhau từ null ở cả hai hướng, ngoại trừ do chỉ có cơ hội?
whuber

Tình huống tôi có trong đầu là một tình huống giống như trong bài kiểm tra chi bình phương của Pearson, nơi người ta quan tâm đến việc phân phối theo kinh nghiệm có khác với null hay không; sau đó sai lệch ở một trong hai hướng quan trọng. Nhưng sau khi cho nó một ý nghĩ thứ hai, tôi đoán trực giác của bạn là chính xác và trong trường hợp của tôi, những sai lệch đáng ngờ đều theo một hướng. Nếu bạn đăng nhận xét của mình dưới dạng câu trả lời và cung cấp một số chi tiết về mô phỏng nhanh của bạn (tôi rất tò mò tại sao phương pháp chi bình phương hóa ra lại kém mạnh mẽ hơn!), Tôi sẽ vui lòng chấp nhận nó.
amip nói rằng Phục hồi lại

Tổng n điểm Z có phân phối với phương sai n? Tại sao phương sai của bình phương sai số chuẩn của giá trị trung bình? Tổng số như ngụ ý trong tiêu đề có sự khác biệt của N. Có lẽ tôi đang thiếu một cái gì đó rõ ràng? Z2
russellpierce

Câu trả lời:


17

Một lỗ hổng nhảy ra là phương pháp của Stouffer có thể phát hiện sự dịch chuyển có hệ thống trong , đó là điều người ta thường mong đợi sẽ xảy ra khi một phương án thay thế luôn đúng, trong khi phương pháp chi bình phương dường như có ít năng lượng hơn để làm như vậy. Một mô phỏng nhanh cho thấy đây là trường hợp; phương pháp chi bình phương ít mạnh hơn để phát hiện phương án một phía. Dưới đây là biểu đồ của các giá trị p theo cả hai phương thức (red = Stouffer, blue = chi-squared) cho lần lặp độc lập với và các hiệu ứng được tiêu chuẩn hóa một phía khác nhau từ không ( ) qua SD ( ).10 5 N = 10 μ μ = 0 0,6 μ = 0,6ztôi105N= =10μμ= =00,6μ= =0,6

Nhân vật

μ


Mã R

Điều này bao gồm phương pháp của Fisher (nhận xét) để so sánh.

n <- 10
n.iter <- 10^5
z <- matrix(rnorm(n*n.iter), ncol=n)

sim <- function(mu) {
  stouffer.sim <- apply(z + mu, 1, 
                    function(y) {q <- pnorm(sum(y)/sqrt(length(y))); 2*min(q, 1-q)})
  chisq.sim <- apply(z + mu, 1, 
                    function(y) 1 - pchisq(sum(y^2), length(y)))
  #fisher.sim <- apply(z + mu, 1,
  #                  function(y) {q <- pnorm(y); 
  #                     1 - pchisq(-2 * sum(log(2*pmin(q, 1-q))), 2*length(y))})
  return(list(stouffer=stouffer.sim, chisq=chisq.sim, fisher=fisher.sim))
}

par(mfrow=c(2, 3))
breaks=seq(0, 1, .05)
tmp <- sapply(c(0, .1, .2, .3, .4, .6), 
              function(mu) {
                x <- sim(mu); 
                hist(x[[1]], breaks=breaks, xlab="p", col="#ff606060",
                     main=paste("Mu =", mu)); 
                hist(x[[2]], breaks=breaks, xlab="p", col="#6060ff60", add=TRUE)
                #hist(x[[3]], breaks=breaks, xlab="p", col="#60ff6060", add=TRUE)
                })

Cảm ơn một lần nữa, điều này là rất tốt đẹp. Và điều gì xảy ra nếu bạn không chú ý đến phương pháp của Fisher? Tôi nghi ngờ bạn đã thử nó. Stouffer có liên tục chiến thắng không? (Xin lỗi vì đã không tự mình thử, nhưng tôi không có kinh nghiệm với R và không có nó trong tay.)
amip nói rằng Rebstate Monica

μNN

1
Bạn có thể dễ dàng sửa đổi Rmô phỏng để kiểm tra điều này. Nó sẽ là một cách tốt để giới thiệu bản thân với nền tảng điện toán thống kê này. :-)
whuber

2
ztôiztôi

Thảo luận tuyệt vời và QA! Một câu hỏi nhanh: nếu một người hình thành vấn đề này như một phát hiện ngoại lệ / dị thường bằng cách tính khoảng cách Mahalanobis và làm theo một cái gì đó như thế này thì sao?
NULL

10

Một cách chung để đạt được cái nhìn sâu sắc về thống kê kiểm tra là rút ra các giả định cơ bản (thường là ngầm) sẽ dẫn đến thống kê kiểm tra đó là mạnh nhất. Đối với trường hợp cụ thể này, một sinh viên và tôi gần đây đã thực hiện điều này: http://arxiv.org/abs/1111.1210v2 (phiên bản sửa đổi sẽ xuất hiện trong Biên niên sử Thống kê Ứng dụng).

Tóm tắt ngắn gọn (và phù hợp với kết quả mô phỏng trong câu trả lời khác) Phương pháp của Stouffer sẽ mạnh nhất khi các hiệu ứng cơ bản "thực" đều bằng nhau; tổng của Z ^ 2 sẽ mạnh nhất khi các hiệu ứng cơ bản thường được phân phối khoảng 0. Đây là một sự đơn giản hóa nhỏ mà bỏ qua chi tiết: xem phần 2.5 trong bản in sẵn arxiv được liên kết ở trên để biết thêm chi tiết.


2
(+1) Bằng cách nào đó tôi nghĩ rằng tôi đã viết nó từ lâu, nhưng có vẻ như tôi đã không: cảm ơn rất nhiều vì đã đăng ký ở đây để trả lời câu hỏi của tôi! Tôi đánh giá cao nó. Mục 2.5 trong bài viết của bạn thực sự rất phù hợp.
amip nói rằng Phục hồi lại

3

Hơi o / t: một trong những vấn đề với cả hai cách tiếp cận này là sự mất quyền lực do mức độ tự do (N đối với người lái xe; 2N đối với Fisher). Đã có những cách tiếp cận phân tích tổng hợp tốt hơn được phát triển cho điều này, mà bạn có thể muốn xem xét (ví dụ phân tích meta có trọng số phương sai).

Nếu bạn đang tìm kiếm bằng chứng của một số thử nghiệm thay thế trong một nhóm, bạn có thể muốn xem thống kê chỉ trích cao hơn của Donoho và Jin: https://projecteuclid.org/euclid.aos/1085408492


1

Để trả lời câu hỏi và cho bất kỳ độc giả nào khác: nó đã từng được sử dụng chưa?, Có một bài viết đầy đủ của Cousins ​​(2008) trên arXiv, trong đó liệt kê và xem xét một vài cách tiếp cận khác. Một đề xuất dường như không xuất hiện.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.