sử dụng trọng lượng trong svyglm vs glm


18

Tôi muốn biết cách điều trị của trọng lượng khác nhau giữa svyglmglm

Tôi đang sử dụng twanggói trong R để tạo điểm số xu hướng sau đó được sử dụng làm trọng số, như sau (mã này xuất phát từ twangtài liệu):

library(twang)
library(survey)
set.seed(1)

data(lalonde)

ps.lalonde <- ps(treat ~ age + educ + black + hispan + nodegree + married + re74 + re75,
 data = lalonde)

lalonde$w <- get.weights(ps.lalonde, stop.method="es.mean")
design.ps <- svydesign(ids=~1, weights=~w, data=lalonde)

glm1 <- svyglm(re78 ~ treat, design=design.ps)

summary(glm1)

...
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      374.4  17.853   <2e-16 ***
treat         -432.4      753.0  -0.574    0.566    

So sánh điều này với:

glm11 <- glm(re78 ~ treat, weights=w , data=lalonde)
summary(glm11)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      362.5  18.441   <2e-16 ***
treat         -432.4      586.1  -0.738    0.461  

Vì vậy, các ước tính tham số là như nhau nhưng các lỗi tiêu chuẩn cho điều trị là khá khác nhau.

Làm thế nào để điều trị trọng lượng khác nhau giữa svyglmglm?

Câu trả lời:


11

Có rất nhiều loại trọng lượng khác nhau và chúng gây nhầm lẫn. Bạn phải khá cẩn thận khi bạn đang sử dụng các chức năng hoặc phần mềm khác nhau mà bạn đang sử dụng loại trọng lượng bạn nghĩ bạn đang sử dụng.

Hàm svyglm sử dụng các trọng số khảo sát - các trọng số này tầm quan trọng của từng trường hợp để biến chúng thành đại diện (cho nhau, sau twang). Tôi không chắc trọng lượng nào trong glm () - Tôi nghĩ rằng chúng đại diện cho tính chính xác của các biện pháp. (Nếu bạn đang sử dụng họ nhị thức, chúng có ý nghĩa khác nhau).

Các trọng số khảo sát (trong Surveyglm) là các trọng số mà bạn muốn, để cung cấp cho bạn các lỗi tiêu chuẩn chính xác.

(Ngoài ra còn có trọng số tần số, trọng lượng phân tích và trọng số quan trọng).


(+1) cảm ơn bạn. Bạn có biết một tài liệu tham khảo có thể truy cập cho các trọng số khảo sát, ngoài các tài liệu cho surveyglm) không?
Joe King


1
Cảm ơn đã tham khảo., Có thể truy cập tôi có nghĩa là một cái gì đó có sẵn trực tuyến, xin lỗi. Tôi không dễ dàng truy cập vào các thư viện tốt ....
Joe King

Hmmm ... tôi không nhớ là đã gặp bất cứ thứ gì, nhưng tôi sẽ thấy những gì tôi có thể tìm thấy.
Jeremy Miles

9

surveytính toán các lỗi tiêu chuẩn với việc xem xét sự mất độ chính xác được đưa ra bằng các trọng số lấy mẫu. Trọng số glmchỉ đơn giản là điều chỉnh trọng số cho các lỗi trong ước lượng bình phương nhỏ nhất, do đó, các lỗi tiêu chuẩn không chính xác. Đây là một lựa chọn từ Lumley (2010):

Trong phân tích dựa trên mô hình, cần phải xác định chính xác phần ngẫu nhiên của mô hình để có được các lỗi tiêu chuẩn chính xác, nhưng tất cả các ước tính lỗi tiêu chuẩn của chúng tôi đều dựa trên thiết kế và do đó là hợp lệ bất kể mô hình. Điều đáng chú ý là các lỗi tiêu chuẩn của dòng bánh sandwich kẹp thịt, hay mô hình mạnh mẽ, hoặc các lỗi tiêu chuẩn không đồng nhất, đôi khi được sử dụng trong phân tích hồi quy dựa trên mô hình gần như giống với các lỗi tiêu chuẩn dựa trên thiết kế mà chúng ta sẽ sử dụng; sự khác biệt chính là trong việc xử lý phân tầng.

Vì vậy, không có tầng lớp trong thiết kế của bạn, bạn có thể thấy rằng việc sử dụng sandwichsẽ giúp bạn có được ước tính SE giống hệt hoặc gần giống nhau.

library(sandwich)
coefs <- vcovHC(glm11, type="HC0")
lmtest::coeftest(glm11,coefs)

Trong thử nghiệm của tôi, họ đã không tính toán chính xác khi sử dụng "HC0" hoặc "HC1", nhưng rất gần. svyglmhiện đang báo cáo giá trị z thay vì giá trị t.


2
Nếu hữu ích cho độc giả trong tương lai: coeftestlà từ gói R lmtest.
swihart
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.