Tôi quan tâm đến việc mô hình hóa dữ liệu phản hồi nhị phân trong các quan sát được ghép nối. Chúng tôi hướng đến việc suy luận về hiệu quả của can thiệp trước bài trong một nhóm, có khả năng điều chỉnh cho một số hiệp phương sai và xác định xem có sự điều chỉnh hiệu quả của một nhóm được đào tạo đặc biệt khác như một phần của can thiệp hay không.
Cho dữ liệu theo mẫu sau:
id phase resp
1 pre 1
1 post 0
2 pre 0
2 post 0
3 pre 1
3 post 0
Và một bảng dự phòng thông tin phản hồi được ghép nối:
Chúng tôi quan tâm đến việc kiểm tra giả thuyết: .
Thử nghiệm của McNemar đưa ra: trong (không có triệu chứng). Điều này là trực quan bởi vì, dưới giá trị null, chúng tôi sẽ mong đợi một tỷ lệ bằng nhau của các cặp bất hòa ( và ) sẽ ủng hộ hiệu ứng tích cực ( ) hoặc hiệu ứng tiêu cực ( ). Với xác suất xác định trường hợp dương được xác định và . Tỷ lệ quan sát một cặp đối nghịch tích cực là . H0bcbcp=b n=b+cp
Mặt khác, hồi quy logistic có điều kiện sử dụng một cách tiếp cận khác để kiểm tra cùng một giả thuyết, bằng cách tối đa hóa khả năng có điều kiện:
trong đó .
Vậy, mối quan hệ giữa các thử nghiệm này là gì? Làm thế nào người ta có thể làm một bài kiểm tra đơn giản của bảng dự phòng được trình bày trước đó? Nhìn vào việc hiệu chỉnh giá trị p từ các cách tiếp cận của clogit và McNemar dưới giá trị null, bạn sẽ nghĩ rằng chúng hoàn toàn không liên quan!
library(survival)
n <- 100
do.one <- function(n) {
id <- rep(1:n, each=2)
ph <- rep(0:1, times=n)
rs <- rbinom(n*2, 1, 0.5)
c(
'pclogit' = coef(summary(clogit(rs ~ ph + strata(id))))[5],
'pmctest' = mcnemar.test(table(ph,rs))$p.value
)
}
out <- replicate(1000, do.one(n))
plot(t(out), main='Calibration plot of pvalues for McNemar and Clogit tests',
xlab='p-value McNemar', ylab='p-value conditional logistic regression')
exact2x2
có thể là tài liệu tham khảo.