McNemar hoặc Fisher kiểm tra chính xác cho điểm số phù hợp với dữ liệu phù hợp?


7

Tôi muốn phân tích một số điểm phù hợp với dữ liệu. Trong tài liệu, kiểm tra McNemar thường được sử dụng, vì dữ liệu được "ghép nối". Tuy nhiên, kết hợp không được ghép nối theo nghĩa thông thường.

Nó sẽ chính xác hơn để sử dụng thử nghiệm chính xác của Fisher? Có ý kiến ​​gì về việc sử dụng các bài kiểm tra ghép cho dữ liệu trùng khớp?


Một câu hỏi liên quan với các chi tiết kỹ thuật: stats.stackexchange.com/questions/147559/ Kẻ
Viktor

Câu trả lời:


8

Đây chắc chắn là một cuộc tranh luận đang diễn ra trong tài liệu, nhưng tại thời điểm này, bằng chứng chỉ ra việc sử dụng phân tích ghép nối để tính toán các lỗi tiêu chuẩn và giá trị p. Mặc dù mục tiêu của kết hợp là đến hai mẫu bắt chước thử nghiệm đối chứng ngẫu nhiên, không phải là thử nghiệm đối chứng ngẫu nhiên theo cặp, nhưng kết hợp vẫn tạo ra một hiệp phương sai giữa các kết quả trong mỗi bộ đối sánh, cần phải tính đến suy luận. PC Austin đã viết rất nhiều về điều này (ví dụ, Austin & Small, 2014). Zubizarreta, Paredes, & Rosenbaum (2014) đã chỉ ra rằng sau khi khớp (nghĩa là loại bỏ các đơn vị chưa từng có), ghép nối (nghĩa là tạo các cặp khớp) có thể làm giảm độ nhạy của ước tính cuối cùng để gây nhiễu và giảm các lỗi tiêu chuẩn, chỉ có thể nhận ra nếu phân tích ghép được sử dụng trên mẫu.


"... mục tiêu của việc kết hợp là đến hai mẫu bắt chước thử nghiệm kiểm soát ngẫu nhiên" Điều đó không đúng. Mục tiêu của kết hợp là loại bỏ nhiễu bằng cách loại bỏ bất kỳ mối liên hệ nào giữa các yếu tố phù hợp và tùy chọn điều trị . RCT làm điều này với ngẫu nhiên. Sự phân phối các yếu tố gây nhiễu trong một mẫu ngẫu nhiên là đại diện của những người tham gia thử nghiệm. Với sự phân phối phù hợp của các yếu tố gây nhiễu đó, tương tự như của những người lựa chọn điều trị hiếm hơn.
AdamO

1
Điều đó đúng, nhưng có thể phù hợp với ATE, đó là những gì được ước tính trong một RCT. Tôi chỉ chứng thực trực giác của OP rằng khớp PS rõ ràng không giống với ghép nối, giống như cách RCT không giống với RCT được ghép nối.

Được rồi, có vẻ như chúng tôi đồng ý. Nói tóm lại: kết hợp / ngẫu nhiên là giống nhau khi nó có nghĩa là để loại bỏ nhiễu, nhưng chúng dẫn đến sự phân phối các yếu tố khác nhau trong mẫu kết quả. Các thiết kế có giá trị để ước tính ATE khi không có tương tác không bị phát hiện với điều trị, nếu không, hai phương pháp có thể tạo ra kết quả khác nhau / mâu thuẫn.
AdamO

Vì dữ liệu trùng khớp không phải là dữ liệu được ghép nối và không phải là dữ liệu từ các nhóm độc lập, nên một số thử nghiệm mới có thể được phát triển riêng cho dữ liệu khớp?
Viktor

1
Nhiều người đã cố gắng làm việc này. Công việc của Abadie và Imbens xuất hiện trong đầu tôi, nhưng tôi không biết nhiều về nó. Cho đến nay, phân tích cặp là thích hợp nhất.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.