Nói một cách đơn giản, các giả định của hồi quy tuyến tính là gì?
Tôi chỉ muốn biết rằng khi tôi có thể áp dụng mô hình hồi quy tuyến tính cho tập dữ liệu của chúng tôi.
Nói một cách đơn giản, các giả định của hồi quy tuyến tính là gì?
Tôi chỉ muốn biết rằng khi tôi có thể áp dụng mô hình hồi quy tuyến tính cho tập dữ liệu của chúng tôi.
Câu trả lời:
Có ba giả định chính (nói theo thống kê):
Có một mối quan hệ tuyến tính giữa các biến phụ thuộc và biến hồi quy (hình bên phải bên dưới), có nghĩa là mô hình bạn đang tạo thực sự phù hợp với dữ liệu.
Các lỗi hoặc phần dư của dữ liệu thường được phân phối và độc lập với nhau.
Tính đồng nhất. Điều này có nghĩa là phương sai xung quanh đường hồi quy là giống nhau cho tất cả các giá trị của biến dự đoán.
Cập nhật 2 :: Multicollinearity không phải là một giả định, nhưng nó là một kiểm tra độ tỉnh táo đặc biệt là nếu khả năng diễn giải của mô hình là quan trọng (cảm ơn vì bình luận của Ricardo Cruz). Multicollinearity xảy ra khi các biến độc lập không độc lập với nhau. Đa cộng tuyến giữa các biến giải thích có thể dẫn đến sự phù hợp với tham số kém ổn định hơn (cảm ơn KT. Đã chỉ ra điều này)). Có các thử nghiệm như ma trận tương quan (Tương quan Bivariate của Pearson), Hệ số lạm phát phương sai có thể được sử dụng để xác minh điều này.
Homoscedasticity
tốt hơn một chút với một ví dụ? Nó không được rõ. Bạn đã đánh dấu một trong những câu hỏi của tôi là một bản sao mà tôi đang tìm kiếm một cái nhìn tốt hơn về nó. Bạn có thể giải thích?