Lưu ý rằng giả định tuyến tính mà bạn đang nói chỉ nói rằng giá trị trung bình có điều kiện của cho X i là hàm tuyến tínhYiXi . Bạn không thể sử dụng giá trị của để kiểm tra giả định này.R2
Điều này là do chỉ là mối tương quan bình phương giữa các giá trị được quan sát và dự đoán và giá trị của hệ số tương quan không xác định duy nhất mối quan hệ giữa X và Y (tuyến tính hoặc cách khác) và cả hai kịch bản sau đây đều có thể: R2XY
Tôi sẽ thảo luận lần lượt từng cái:
R2X1,...,Xn99%M1%
Yi={ZiMif Xi≠Mif Xi=M
Zi∼N(μ,1)Mμμ=0,M=105XiYi
u = runif(1e4)>.99
x = rnorm(1e4)
x[which(u==1)] = 1e5
y = rnorm(1e4)
y[which(x==1e5)] = 1e5
cor(x,y)
[1] 1
YiXiYiXiXi=M .
R2XiYi
Yi=β0+β1Xi+εi
YiXiXivar(εi)=σ2β1R2
x = rnorm(200)
y = 1 + 2*x + rnorm(200,sd=5)
cor(x,y)^2
[1] 0.1125698
R2
Re: Phải làm gì khi giả định tuyến tính không được đáp ứng và biến đổi IV cũng không giúp ích gì? !!
Khi phi tuyến tính là một vấn đề, có thể hữu ích khi xem xét các lô của phần dư so với từng yếu tố dự đoán - nếu có bất kỳ mẫu đáng chú ý nào, điều này có thể chỉ ra tính phi tuyến tính trong dự báo đó. Ví dụ, nếu âm mưu này cho thấy mối quan hệ "hình bát" giữa phần dư và yếu tố dự đoán, thì điều này có thể chỉ ra một thuật ngữ bậc hai bị thiếu trong yếu tố dự đoán đó. Các mẫu khác có thể chỉ ra một hình thức chức năng khác nhau. Trong một số trường hợp, có thể bạn chưa thử chuyển đổi đúng hoặc mô hình thực không tuyến tính trong bất kỳ phiên bản biến đổi nào của biến (mặc dù có thể tìm được xấp xỉ hợp lý).
R2