Ý nghĩa của các hệ số hồi quy (GAM) khi khả năng mô hình không cao hơn đáng kể so với null


10

Tôi đang chạy hồi quy dựa trên GAM bằng cách sử dụng gói gamlss R và giả sử phân phối beta không bị thổi phồng dữ liệu. Tôi chỉ có một biến giải thích duy nhất trong mô hình của mình, vì vậy về cơ bản là : mymodel = gamlss(response ~ input, family=BEZI).

Thuật toán cung cấp cho tôi hệ số cho tác động của biến giải thích thành giá trị trung bình ( ) và giá trị p liên quan cho , đại loại như:kμk(input)=0

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

Như bạn có thể thấy trong ví dụ trên, giả thuyết bị từ chối với độ tin cậy cao.k(input)=0

Sau đó tôi chạy mô hình null: null = gamlss(response ~ 1, family=BEZI)và so sánh khả năng sử dụng thử nghiệm tỷ lệ khả năng:

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

Trong một số trường hợp, tôi nhận được ngay cả khi các hệ số ở đầu vào được báo cáo là rất có ý nghĩa (như trên). Tôi thấy điều này khá bất thường - ít nhất nó chưa bao giờ xảy ra theo kinh nghiệm của tôi với hồi quy tuyến tính hoặc logistic (thực tế, điều này cũng không bao giờ xảy ra khi tôi đang sử dụng gamma điều chỉnh bằng 0 với gamlss).p>0.05

Câu hỏi của tôi là: tôi vẫn có thể tin tưởng vào sự phụ thuộc giữa phản hồi và đầu vào khi gặp trường hợp này không?

Câu trả lời:


1

Tôi thấy không có lý do ngay lập tức tại sao điều này nên liên quan đến GAM. Thực tế là bạn đang sử dụng hai bài kiểm tra cho cùng một điều. Vì không có sự chắc chắn tuyệt đối trong thống kê, nên rất có thể có một kết quả quan trọng và cái kia thì không.

Có lẽ một trong hai bài kiểm tra đơn giản là mạnh hơn (nhưng sau đó có thể dựa vào một số giả định khác), hoặc có thể một bài kiểm tra quan trọng duy nhất là lỗi loại một trong hai mươi của bạn.

Một ví dụ điển hình là các thử nghiệm cho dù các mẫu có đến từ cùng một phân phối hay không: bạn có các thử nghiệm rất tham số cho điều đó (thử nghiệm T là một thử nghiệm có thể được sử dụng cho việc này: nếu phương tiện khác nhau, thì các phân phối cũng vậy) và cả không phân tích những cái: có thể xảy ra rằng cái tham số cho kết quả quan trọng và cái không tham số không. Điều này có thể là do các giả định của thử nghiệm tham số là sai, vì dữ liệu đơn giản là bất thường (loại I) hoặc do kích thước mẫu không đủ để thử nghiệm không tham số nhận được sự khác biệt, hoặc, cuối cùng, vì khía cạnh của những gì bạn thực sự muốn kiểm tra (các bản phân phối khác nhau) được kiểm tra bằng các thử nghiệm khác nhau chỉ khác nhau (các phương tiện khác nhau <-> cơ hội "cao hơn").

Nếu một kết quả xét nghiệm cho thấy kết quả quan trọng và kết quả khác chỉ hơi không đáng kể, tôi sẽ không lo lắng quá nhiều.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.