Tại sao phương pháp của Stouffer hoạt động?


8

Có vẻ như là một câu hỏi khá đơn giản, nhưng khi tôi thực sự nghĩ về nó, phương pháp của Stouffer không có ý nghĩa với tôi. Đây là lý do tại sao:

Giả sử một giả thuyết hai đuôi. Trước tiên, bạn tính từ giá trị . Vì vậy, hãy lấy một ví dụ khá đơn giản. Chúng ta hãy xem hai -values của . Điều này có nghĩa là và đều là . Theo phương pháp của Stouffer, và được kết hợp sao cho: p p 0,05 z 1 z 21,96 z 1 z 2zipp0.05z1z21.96z1z2

Z=i=1kZik=1.96+1.962=2.77

Điểm này sau đó được chuyển đổi thành giá trị một lần nữa, dẫn đến giá trị là , trong khi giá trị từ mỗi riêng lẻ là khoảng .p p 0,005 p z i 0,05zpp0.005pzi0.05

Theo nghĩa này, dường như thử nghiệm của Stouffer thay đổi một cách giả tạo giá trị kết quả thành một giá trị không giống với giá trị của mỗi , mà đối với tôi, không có ý nghĩa gì.p z tôippzi

Tôi có hiểu nhầm bài kiểm tra này không hoặc ai đó có thể giúp tôi hiểu cách thức / lý do tại sao nó hoạt động không?


3
(+1) Nhưng xin lưu ý rằng phương pháp của Stouffer trong hình thức này không phù hợp với các lựa chọn thay thế hai đuôi. Vấn đề là nó bỏ qua khả năng một nghiên cứu có thể đã tìm thấy một hiệu ứng theo hướng này và hướng khác, một hiệu ứng theo hướng ngược lại. Người ta phải kiểm tra rằng điều này đã không xảy ra. Để có được câu hỏi của bạn: "nhân tạo" này theo nghĩa nào? Ghi nhớ mục đích là kết hợp bằng chứng để hỗ trợ cho việc ra quyết định. Chẳng phải nó có ý nghĩa rằng hai kết quả quan trọng phải tạo thành sự hỗ trợ mạnh mẽ hơn cho một quyết định hơn là một mình sao?
whuber

Khi tôi viết rằng nó có vẻ "giả tạo", tôi có nghĩa là trong trường hợp có hai mẫu (N = 2), sẽ luôn có lạm phát trong điểm Z, dẫn đến giá trị p thấp hơn so với dự kiến điểm z ( ). Mặc dù có ý nghĩa rằng hai kết quả quan trọng sẽ dẫn đến sự hỗ trợ mạnh mẽ hơn cho quyết định so với một mình, nhưng điều đó không có nghĩa đối với hai giá trị p được thực hiện theo phương pháp của Stouffer và kết quả hoàn toàn khác với p- giá trị. zi
sẽ

2
@will, tôi không thể hiểu câu cuối cùng của bình luận đầu tiên (dài) của bạn ở đây. Vâng, điều đó có nghĩa là hai kết quả quan trọng mang lại sự hỗ trợ mạnh mẽ hơn khi kết hợp. Điều đó có nghĩa là giá trị p kết hợp cũng có thể thấp hơn một trong hai. Vậy vấn đề là gì?
amip

2
Tôi đã nghĩ rằng một cách để phát triển trực giác của bạn sẽ là đảo ngược quy trình này: thực hiện một nghiên cứu duy nhất và chia nó thành hai phần ngẫu nhiên, sau đó phân tích từng phần riêng biệt. Một ví dụ rất đơn giản, hãy xem xét một cuộc khảo sát sau bầu cử trong đó 1000 người được thăm dò ý kiến ​​và 535 người cho biết họ đã bỏ phiếu cho đương nhiệm và 465 cho đối thủ của mình. Một phân chia ngẫu nhiên có thể đi 265-235 trong một nửa và 270-230 trong nửa còn lại. Các giá trị p để kiểm tra sự bằng nhau của tỷ lệ trong hai nửa và giá trị p là gì? (Trong R, tính toán bằng cách sử dụng prop.test(535,1000), v.v.)
whuber

2
Bạn dường như nhầm lẫn giữa ước tính mẫu của tỷ lệ với giá trị p của thử nghiệm !! Giá trị p tổng thể là 0,03 trong khi giá trị p của hai nửa là 0,08 và 0,19.
whuber

Câu trả lời:


7

Kích thước mẫu tổng thể cao hơn dẫn đến công suất cao hơn và do đó giá trị p nhỏ hơn (ít nhất là nếu giả thuyết làm việc được hỗ trợ bởi dữ liệu).

Đây thường là điểm chính của bất kỳ phân tích tổng hợp nào: nhiều bằng chứng yếu hỗ trợ cho một giả thuyết được kết hợp với bằng chứng mạnh mẽ cho nó.


Vì thuật ngữ thống kê "sức mạnh" trong ngữ cảnh này có ý nghĩa khác biệt rõ rệt so với giá trị p, tôi lo ngại rằng giải thích này có thể gây ra một số nhầm lẫn giữa chúng.
whuber

Vì vậy, điều này có nghĩa là trong trường hợp kích thước mẫu là 2, sức mạnh của phương pháp Stouffer sẽ luôn giảm xuống và giá trị p sẽ luôn nhỏ hơn? Làm thế nào có thể có được một câu trả lời chính xác hơn khi kích thước mẫu là hai?
sẽ

p=0.05NN=N1+N2N1+N2

2

Để đơn giản, hãy nghĩ về một bài kiểm tra về phương tiện. Giả sử theo H0 hiệu quả điều trị bằng 0, sao cho mỗi giá trị z là ước tính trọng số của hiệu quả điều trị θi. Phương pháp của Stouffer cho trung bình không có trọng số của các hiệu ứng điều trị này, do đó sẽ đưa ra ước tính chính xác hơn (và do đó giá trị p nhỏ hơn) so với mỗi giá trị z riêng biệt. Ước tính không có trọng số này về hiệu quả điều trị là sai lệch nhưng phương pháp Stouffer có trọng số là có thể, và nếu các trọng số tỷ lệ với 1 / sai số chuẩn (θi) thì ước tính hiệu quả điều trị là không thiên vị. Tuy nhiên, điều này chỉ có ý nghĩa nếu các giá trị z riêng biệt là các số đo có cùng số lượng. Một lợi thế của phương pháp của Stouffer và Fisher là chúng cũng có thể được áp dụng cho các phân tích tổng hợp trong đó các biến phản ứng khác nhau đã được chọn - vì vậy chúng có thể '



-2

Tôi nghĩ sẽ tốt hơn nếu kết hợp các kết quả 2 đuôi vì điều đó có nghĩa là kết quả sẽ bằng không (nếu có bằng chứng cho thấy việc điều trị làm tăng bệnh [đuôi phải] cho bệnh nhân nhưng cũng là bằng chứng cho thấy nó xấu đi -chuyển], kết quả cuối cùng không có bằng chứng đối với một giả thuyết cụ thể vì chúng hủy bỏ và cần phải quan sát nhiều hơn.


1
Tôi không nghĩ rằng điều này giải quyết câu hỏi. Ngoài ra, nhận xét của người cho biết phương pháp cụ thể này không hoạt động đối với các thử nghiệm 2 đuôi.
mkt - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.