Tôi có một mô hình tuyến tính cổ điển, với 5 biến hồi quy có thể. Chúng không tương quan với nhau và có mối tương quan khá thấp với phản ứng. Tôi đã đến một mô hình trong đó 3 trong số các biến hồi quy có hệ số đáng kể cho thống kê t của chúng (p <0,05). Việc thêm một hoặc cả hai biến còn lại sẽ cho giá trị p> 0,05 cho thống kê t, cho các biến được thêm. Điều này khiến tôi tin rằng mô hình 3 biến là "tốt nhất".
Tuy nhiên, sử dụng lệnh anova (a, b) trong R trong đó a là mô hình 3 biến và b là mô hình đầy đủ, giá trị p cho thống kê F là <0,05, cho tôi biết mô hình đầy đủ hơn 3 biến mô hình. Làm thế nào tôi có thể hòa giải những mâu thuẫn rõ ràng này?
Cảm ơn PS Chỉnh sửa: Một số nền tảng hơn nữa. Đây là bài tập về nhà nên tôi sẽ không đăng chi tiết, nhưng chúng tôi không cung cấp chi tiết về những gì các biến hồi quy đại diện - chúng chỉ được đánh số từ 1 đến 5. Chúng tôi được yêu cầu "rút ra một mô hình phù hợp, đưa ra lời biện minh".