Tôi hơi bối rối về các giả định của hồi quy tuyến tính là gì.
Cho đến nay tôi đã kiểm tra xem:
- tất cả các biến giải thích tương quan tuyến tính với biến trả lời. (Đây là trường hợp)
- có bất kỳ sự cộng tác nào giữa các biến giải thích. (có ít sự cộng tác).
- khoảng cách của các điểm dữ liệu của mô hình của tôi là dưới 1 (đây là trường hợp, tất cả các khoảng cách đều dưới 0,4, vì vậy không có điểm ảnh hưởng nào).
- phần dư được phân phối bình thường. (Điều này có thể không phải là trường hợp)
Nhưng sau đó tôi đọc như sau:
vi phạm tính quy phạm thường phát sinh do (a) phân phối của các biến phụ thuộc và / hoặc độc lập tự chúng không bình thường đáng kể và / hoặc (b) giả định tuyến tính bị vi phạm.
Câu hỏi 1 Điều này làm cho âm thanh như thể các biến độc lập và phụ thuộc cần được phân phối bình thường, nhưng theo như tôi biết thì đây không phải là trường hợp. Biến phụ thuộc của tôi cũng như một trong các biến độc lập của tôi thường không được phân phối. Họ có nên?
Câu hỏi 2 Cốt truyện QQ của tôi về phần dư trông như thế này:
Điều đó hơi khác với phân phối bình thường và shapiro.test
cũng bác bỏ giả thuyết khống rằng phần dư là từ phân phối bình thường:
> shapiro.test(residuals(lmresult))
W = 0.9171, p-value = 3.618e-06
Phần dư so với giá trị được trang bị trông như sau:
Tôi có thể làm gì nếu phần dư của tôi không được phân phối bình thường? Có nghĩa là mô hình tuyến tính là hoàn toàn vô dụng?