Chưa thử đưa ra dữ liệu để dự đoán, nhưng trực giác của tôi là việc sửa các hiệp phương sai về 0 trong mô hình của bạn tương tự như dự đoán DV bằng cách kết hợp một tập hợp các phương trình hồi quy tuyến tính, đơn IV, riêng biệt. Không giống như phương pháp này, nhiều hồi quy chiếm tỷ lệ hiệp phương sai trong IV khi tạo ra một mô hình phương trình để dự đoán DV. Điều này chắc chắn cải thiện khả năng diễn giải bằng cách tách các hiệu ứng trực tiếp khỏi các tác động gián tiếp xảy ra hoàn toàn trong bộ IV được bao gồm. Thành thật mà nói, tôi không chắc liệu điều này có nhất thiết cải thiện dự đoán về DV hay không. Là người sử dụng thống kê và không phải là nhà thống kê, tôi đã kết hợp chức năng kiểm tra mô phỏng sau đây để đưa ra câu trả lời chưa đầy đủ (rõ ràng, "Có, độ chính xác dự đoán sẽ cải thiện khi mô hình kết hợp hiệp phương sai IV") trong trường hợp tương tự hy vọng này ...
simtestit=function(Sample.Size=100,Iterations=1000,IV.r=.3,DV.x.r=.4,DV.z.r=.4) {
require(psych); output=matrix(NA,nrow=Iterations,ncol=6); for(i in 1:Iterations) {
x=rnorm(Sample.Size); z=rnorm(Sample.Size)+x*IV.r
y=rnorm(Sample.Size)+x*DV.x.r+z*DV.z.r
y.predicted=x*lm(y~x+z)$coefficients[2]+z*lm(y~x+z)$coefficients[3]
bizarro.y.predicted=x*lm(y~x)$coefficients[2]+z*lm(y~z)$coefficients[2]
output[i,]=c(cor(y.predicted,y)^2,cor(bizarro.y.predicted,y)^2,
cor(y.predicted,y)^2>cor(bizarro.y.predicted,y)^2,cor(x,z),cor(x,y),cor(y,z))}
list(output=output,percent.of.predictions.improved=100*sum(output[,3])/Iterations,
mean.improvement=fisherz2r(mean(fisherz(output[,1])-fisherz(output[,2]))))}
# Wrapping the function in str( ) gives you the gist without filling your whole screen
str(simtestit())
N= = Iterations
nSample.Size
z
= = x
+y
= = x
+ z
+y
x
z
1y.predicted
2bizarro.y.predicted
output
Iterations
R2121 > 2rx
y
z
output
simtestit()
str( )
R21rpsych
R2R2IV.r
) lớn hơn. Vì bạn có thể quen thuộc với chức năng GLM của bạn hơn tôi (hoàn toàn không phải vậy), nên bạn có thể thay đổi chức năng này hoặc sử dụng ý tưởng cơ bản để so sánh các dự đoán GLM qua nhiều IV mà bạn muốn mà không gặp quá nhiều khó khăn. Giả sử rằng điều đó sẽ (hoặc không) diễn ra theo cùng một cách, có vẻ như câu trả lời cơ bản cho câu hỏi thứ hai của bạn có lẽ là có, nhưng mức độ phụ thuộc vào mức độ mạnh mẽ của IVs. Sự khác nhau về lỗi lấy mẫu giữa dữ liệu được giữ và dữ liệu được sử dụng để phù hợp với mô hình có thể lấn át sự cải thiện về độ chính xác dự đoán của nó trong tập dữ liệu sau, bởi vì một lần nữa, sự cải thiện dường như nhỏ trừ khi tương quan IV mạnh (ít nhất là trong trường hợp cơ bản tối đa chỉ có hai IV).