Bạn đã viết chính xác công cụ ước tính gộp lại:
U¯=1m∑i=1mUi
UiiUiUise(Ui)
Các quy tắc của Rubin sử dụng luật tổng phương sai để ghi lại phương sai dưới dạng tổng của phương sai giữa và trong phạm vi điều khiển:
var(U¯)=E[var(U¯|Ui)]+var(E[U¯|Ui])
E[var(U¯|Ui)=1m∑mi=1ViViivar(E[U¯|Ui])=M+1M−1∑mi=1(Ui−U¯)2
Dù sao, vì số lần cắt ngang được đề xuất là nhỏ (Rubin gợi ý là ít nhất là 5), nên thường có thể tính toán số này bằng cách khớp tay mỗi phân tích. Một ví dụ bằng tay được liệt kê dưới đây:
require(mice)
set.seed(123)
nhimp <- mice(nhanes)
sapply(1:5, function(i) {
fit <- lm(chl ~ bmi, data=complete(nhimp, i))
print(c('coef'=coef(fit)[2], 'var'=vcov(fit)[2, 2]))
})
Cung cấp đầu ra sau:
coef.bmi var
2.123417 4.542842
3.295818 3.801829
2.866338 3.034773
1.994418 4.124130
3.153911 3.531536
Vì vậy, phương sai trong phạm vi là trung bình của phương sai ước tính điểm cụ thể của mức độ cụ thể: 3,8 (trung bình của cột thứ hai). Phương sai giữa là 0,35 phương sai của cột đầu tiên). Sử dụng hiệu chỉnh DF, chúng ta có phương sai 4.23. Điều này đồng ý với pool
lệnh được đưa ra trong mice
gói.
> fit <- with(data=nhimp,exp=lm(chl~bmi))
> summary(pool(fit))
est se t df Pr(>|t|) lo 95 hi 95 nmis fmi lambda
(Intercept) 119.03466 54.716451 2.175482 19.12944 0.04233303 4.564233 233.505080 NA 0.1580941 0.07444487
bmi 2.68678 2.057294 1.305978 18.21792 0.20781073 -1.631731 7.005291 9 0.1853028 0.10051760
trong đó cho thấy SE = 2.057 cho hệ số mô hình, (Phương sai = SE ** 2 = 4.23).
Tôi không thấy việc tăng số lượng bộ dữ liệu bị tranh chấp sẽ tạo ra bất kỳ vấn đề cụ thể nào. Nếu bạn không thể cung cấp một ví dụ về lỗi, tôi không biết làm thế nào để hữu ích hơn. Nhưng kết hợp bằng tay là chắc chắn để phù hợp với một loạt các chiến lược mô hình.
Bài viết này thảo luận về các cách khác mà luật về phương sai tổng thể có thể rút ra các ước tính khác về phương sai của ước tính gộp. Cụ thể, các tác giả chỉ ra (một cách chính xác) rằng giả định cần thiết cho Quy tắc của Rubin không phải là tính quy phạm của các ước tính điểm mà là một thứ gọi là tính đồng nhất. Tính quy tắc của WRT, hầu hết các ước tính điểm đến từ các mô hình hồi quy có sự hội tụ nhanh chóng theo định lý giới hạn trung tâm và bootstrap có thể cho bạn thấy điều này.