Để hỏi rõ hơn câu hỏi của tôi, tôi đã cung cấp một số kết quả đầu ra từ cả mô hình biến 16 ( fit
) và mô hình biến 17 ( fit2
) bên dưới (tất cả các biến dự đoán trong các mô hình này là liên tục, trong đó sự khác biệt duy nhất giữa các mô hình này là fit
không chứa biến 17 (var17)):
fit Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13602.84 R2 0.173 C 0.703
0 69833 d.f. 17 g 1.150 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.160 gamma 0.416
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
fit2 Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13639.70 R2 0.174 C 0.703
0 69833 d.f. 18 g 1.154 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.170 gamma 0.412
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
Tôi đã sử dụng rms
gói của Frank Harrell để xây dựng các lrm
mô hình này . Như bạn có thể thấy, các mô hình này dường như không thay đổi nhiều, nếu có, trên các Chỉ số phân biệt đối xử và Xếp hạng phân biệt . Chỉ số ; tuy nhiên, bằng cách sử dụng lrtest(fit,fit2)
, tôi đã được cung cấp các kết quả sau:
L.R. Chisq d.f. P
3.685374e+01 1.000000e+00 1.273315e-09
Như vậy, chúng tôi sẽ bác bỏ giả thuyết khống về thử nghiệm tỷ lệ khả năng này; tuy nhiên, tôi cho rằng điều này có thể là do kích thước mẫu lớn ( n = 102849) vì các mô hình này dường như hoạt động theo kiểu tương tự. Hơn nữa, tôi quan tâm đến việc tìm ra một cách tốt hơn để so sánh chính thức các mô hình hồi quy logistic nhị phân lồng nhau khi n lớn.
Tôi đánh giá rất cao bất kỳ phản hồi, tập lệnh R hoặc tài liệu nào có thể giúp tôi đi đúng hướng trong việc so sánh các loại mô hình lồng nhau này! Cảm ơn!
fit2
là một mô hình 17 biến, nhưng nó cũng là mô hình bỏ qua V17
. Bạn có thể muốn phù hợp với điều này.
fit2
thành fit
ví dụ trên theo sự điều chỉnh của bạn. Cảm ơn!