Trọng số trong hồi quy lượng tử cho khảo sát phức tạp trong R


8

Tôi muốn bao gồm các trọng số mẫu cho mô hình hồi quy lượng tử của mình, nhưng tôi không chắc làm thế nào để làm điều này.

Tôi đã xác định trọng lượng của mình, trọng số được nhân rộng đã được đưa ra trong tập dữ liệu khảo sát (được tính trong gói khảo sát):

w<-svrepdesign(variables=data[,1:10],repweights=data[,11:30],type="BRR", 
  combined.weights=TRUE, weights=r.weights, rho=0.5,dbname="")

và mô hình rq của tôi là:

rq(y~x,tau=c(.1,.2,.3,.4,.5,.6,.7,.8,.9),data=my.data))

Tôi đã cố gắng sử dụng withReplicateschức năng, nhưng không thành công. Bất kỳ đề xuất?


1
Phần mềm nào bạn đang sử dụng? Trong Stata 13, bạn có thể thêm trọng số khảo sát vào hồi quy lượng tử.
Maarten Buis

1
Hãy chắc chắn rằng những gì bạn đang cân nhắc là một cái gì đó bạn muốn ngoài lề, và nhận ra rằng bạn phải trả một mức giá chênh lệch cao để làm điều này. Nếu cuộc khảo sát nam giới lấy mẫu quá mức và bạn muốn phát triển một ước tính phi giới tính cụ thể thì trọng số là dành cho bạn. Mặt khác, nếu bạn muốn ước tính có điều kiện, nghĩa là bạn muốn điều chỉnh cho quan hệ tình dục như một đồng biến thông thường, thì trọng số có thể phản tác dụng.
Frank Harrell

@FrankHarrell, nếu trong ví dụ của bạn, trọng số là 3 đối với nam và 10 đối với nữ (dưới mức), thì các ước tính trong mỗi nhóm giới cũng tốt như iid và các lỗi tiêu chuẩn của họ không bị ảnh hưởng bởi các trọng số không đồng đều: đối với nam, chúng ta có trong đó tổng kết chỉ dành cho nam giới. ΣTôiwTôiyTôi/ΣTôiwTôi= =3ΣTôiyTôi/ΣTôi1= =y¯
StasK

@Alicja, hãy chắc chắn rằng bạn có lý lẽ biện minh cho những gì bạn sắp làm. Đó là, phương pháp ước lượng phương sai nào cung cấp cho bạn các lỗi tiêu chuẩn phù hợp cho phương pháp của bạn. Đối rqvới dữ liệu iid, các lỗi tiêu chuẩn liên quan đến ước tính mật độ hạt nhân của mật độ lỗi tại một điểm lượng tử đã chọn. Đây có thể hoặc không thể là một đại lượng có ý nghĩa với dữ liệu khảo sát phức tạp. Như vậy, rqdựa trên các phương trình ước lượng không trơn tru liên quan đến các hàm nhảy và lý thuyết BRR thường chỉ được thiết lập để thống kê trơn tru.
StasK 16/03 '

@StasK Tôi không nghĩ đó là tính toán có liên quan. Ước tính cụ thể về giới tính (ví dụ, có điều kiện về giới tính) là những gì họ đang có và không có trọng số là cần thiết hoặc phù hợp. Nếu một người muốn "bỏ mẫu quá mức" một nhóm giới tính, ước tính trọng số kết quả (không điều kiện về giới tính) có độ chính xác thấp, làm giảm hiệu quả kích thước mẫu cho nhóm được lấy mẫu quá mức.
Frank Harrell

Câu trả lời:


3

tôi không chắc câu trả lời @Metrics sẽ đưa ra các lỗi tiêu chuẩn chính xác cho một cuộc gọi quantreg có trọng số khảo sát. đây là một ví dụ về những gì bạn đang cố gắng làm. bạn chắc chắn đang gặp lỗi vì qrhàm được lồng trong withReplicateshàm tại thời điểm này không thể xử lý nhiều tautham số cùng một lúc (mặc dù qrhàm có thể tự hoạt động). chỉ cần gọi một lúc, có lẽ như thế này :)

library(survey)
library(quantreg)

# load some fake data
data(scd)
repweights <-
    cbind(c(4,0,3,0,4,0), c(3,0,0,4,0,3),c(0,3,4,0,0,2),c(0,1,0,4,3,0))

# tack on the fake replicate weights
x <- cbind( scd , repweights )

# tack on some fake main weights
x[,9] <- c( 3 , 2 , 3 , 4 , 1 , 4 )

# name your weight columns
names( x )[ 5:9 ] <- c( paste0( 'rep' , 1:4 ) , "wgt" )

# create a replicate-weighted survey design object
scdrep <-
    svrepdesign(
        data = x ,
        type = "BRR" , 
        repweights = "rep" ,
        weights = ~wgt ,
        combined.weights = TRUE
    )

# loop through each desired value of `tau`
for ( i in seq( 0.1 , 0.9 , by = 0.1 ) ){

    print( i )

    # follow the call described here:
    # http://www.isr.umich.edu/src/smp/asda/Additional%20R%20Examples%20bootstrapping%20with%20quantile%20regression.pdf
    print( 
        withReplicates( 
            scdrep , 
            quote( 
                coef( 
                    rq( arrests ~ alive , tau = i , weights = .weights ) 
                ) 
            )
        )
    )

}

2

Việc sử dụng rqtrong gói quantreg

rq(formula, tau=.5, data, subset, weights, na.action,
method="br", model = TRUE, contrasts, ...)

trong đó, trọng số = vectơ của trọng lượng quan sát; nếu được cung cấp, thuật toán phù hợp để giảm thiểu tổng trọng số nhân thành số dư tuyệt đối. Độ dài của trọng lượng phải giống như số lượng quan sát. Các trọng số phải là không âm và chúng tôi khuyến nghị rằng chúng phải cực kỳ tích cực, vì các trọng số bằng 0 là không rõ ràng.

Hãy chắc chắn rằng bạn có trọng lượng bằng không trong quan sát của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.