Tôi đang chạy hồi quy dựa trên GAM bằng cách sử dụng gói gamlss R và giả sử phân phối beta không bị thổi phồng dữ liệu. Tôi chỉ có một biến giải thích duy nhất trong mô hình của mình, vì vậy về cơ bản là : mymodel = gamlss(response ~ input, family=BEZI)
.
Thuật toán cung cấp cho tôi hệ số cho tác động của biến giải thích thành giá trị trung bình ( ) và giá trị p liên quan cho , đại loại như:
Mu link function: logit
Mu Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.58051 0.03766 -68.521 0.000e+00
input -0.09134 0.01683 -5.428 6.118e-08
Như bạn có thể thấy trong ví dụ trên, giả thuyết bị từ chối với độ tin cậy cao.
Sau đó tôi chạy mô hình null: null = gamlss(response ~ 1, family=BEZI)
và so sánh khả năng sử dụng thử nghiệm tỷ lệ khả năng:
p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).
Trong một số trường hợp, tôi nhận được ngay cả khi các hệ số ở đầu vào được báo cáo là rất có ý nghĩa (như trên). Tôi thấy điều này khá bất thường - ít nhất nó chưa bao giờ xảy ra theo kinh nghiệm của tôi với hồi quy tuyến tính hoặc logistic (thực tế, điều này cũng không bao giờ xảy ra khi tôi đang sử dụng gamma điều chỉnh bằng 0 với gamlss).
Câu hỏi của tôi là: tôi vẫn có thể tin tưởng vào sự phụ thuộc giữa phản hồi và đầu vào khi gặp trường hợp này không?