Câu trả lời:
Một lời giải thích khả dĩ sẽ là sự phi tuyến tính trong mối quan hệ giữa kết quả của bạn và người dự đoán.
Dưới đây là một ví dụ nhỏ. Chúng tôi sử dụng một công cụ dự đoán thống nhất trên . Kết quả, tuy nhiên, không tuyến tính phụ thuộc vào yếu tố dự báo, nhưng trên vuông của dự báo: TRUE có nhiều khả năng cho cả và , nhưng ít có khả năng cho . Trong trường hợp này, một mô hình tuyến tính sẽ xuất hiện không đáng kể, nhưng việc cắt bộ dự đoán thành các khoảng làm cho nó có ý nghĩa.
> set.seed(1)
> nn <- 1e3
> xx <- runif(nn,-1,1)
> yy <- runif(nn)<1/(1+exp(-xx^2))
>
> library(lmtest)
>
> model_0 <- glm(yy~1,family="binomial")
> model_1 <- glm(yy~xx,family="binomial")
> lrtest(model_1,model_0)
Likelihood ratio test
Model 1: yy ~ xx
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 2 -676.72
2 1 -677.22 -1 0.9914 0.3194
>
> xx_cut <- cut(xx,c(-1,-0.3,0.3,1))
> model_2 <- glm(yy~xx_cut,family="binomial")
> lrtest(model_2,model_0)
Likelihood ratio test
Model 1: yy ~ xx_cut
Model 2: yy ~ 1
#Df LogLik Df Chisq Pr(>Chisq)
1 3 -673.65
2 1 -677.22 -2 7.1362 0.02821 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tuy nhiên, điều này không có nghĩa là phân biệt người dự đoán là cách tiếp cận tốt nhất. (Nó gần như không bao giờ.) Tốt hơn nhiều để mô hình hóa phi tuyến bằng cách sử dụng splines hoặc tương tự.
Một cách có thể là nếu mối quan hệ rõ ràng là phi tuyến. Không thể nói (thiếu chi tiết) liệu điều này có thực sự giải thích những gì đang diễn ra không.
Bạn có thể tự kiểm tra. Đầu tiên, bạn có thể thực hiện một biểu đồ biến được thêm vào cho chính biến đó và bạn cũng có thể vẽ các hiệu ứng được trang bị trong phiên bản nhân tố của mô hình. Nếu giải thích là đúng, cả hai sẽ thấy một mô hình phi tuyến rõ rệt.