Giả định hồi quy tuyến tính


7

Nói một cách đơn giản, các giả định của hồi quy tuyến tính là gì?

Tôi chỉ muốn biết rằng khi tôi có thể áp dụng mô hình hồi quy tuyến tính cho tập dữ liệu của chúng tôi.


bạn có thể đánh dấu câu trả lời được chấp nhận nếu nó đủ tốt cho bạn. Nó đã ở đây đôi khi và bạn chưa đánh dấu nó.
TwinPenguins

Câu trả lời:


14

Có ba giả định chính (nói theo thống kê):

  1. Có một mối quan hệ tuyến tính giữa các biến phụ thuộc và biến hồi quy (hình bên phải bên dưới), có nghĩa là mô hình bạn đang tạo thực sự phù hợp với dữ liệu. nhập mô tả hình ảnh ở đây

  2. Các lỗi hoặc phần dư của dữ liệu thường được phân phối và độc lập với nhau. nhập mô tả hình ảnh ở đây

  3. Tính đồng nhất. Điều này có nghĩa là phương sai xung quanh đường hồi quy là giống nhau cho tất cả các giá trị của biến dự đoán. nhập mô tả hình ảnh ở đây

Cập nhật 2 :: Multicollinearity không phải là một giả định, nhưng nó là một kiểm tra độ tỉnh táo đặc biệt là nếu khả năng diễn giải của mô hình là quan trọng (cảm ơn vì bình luận của Ricardo Cruz). Multicollinearity xảy ra khi các biến độc lập không độc lập với nhau. Đa cộng tuyến giữa các biến giải thích có thể dẫn đến sự phù hợp với tham số kém ổn định hơn (cảm ơn KT. Đã chỉ ra điều này)). Có các thử nghiệm như ma trận tương quan (Tương quan Bivariate của Pearson), Hệ số lạm phát phương sai có thể được sử dụng để xác minh điều này.


1
Nói đúng ra, 3 không phải là giả định trực tiếp của mô hình. Tuy nhiên, nó có thể gây phiền toái vì sự cộng tác của các yếu tố đầu vào dẫn đến sự phù hợp với tham số kém ổn định hơn.
KT.

Không thể đồng ý hơn!
TwinPenguins

Sau đó, bạn có thể đặt 2. và 4. cùng nhau thành một câu lệnh đơn giản rằng "lỗi không phụ thuộc vào đầu vào, là các biến ngẫu nhiên bình thường". Điều này để lại với hai giả định, tương ứng chính xác với công thức xác suất của mô hình tuyến tính.
KT.

1
"Điều này có thể dẫn đến sự phù hợp với tham số kém ổn định hơn" - đối với người mới, các bạn nên thêm rằng đây chỉ là mối quan tâm nếu bạn muốn diễn giải các tham số. Chỉ vì các tham số không ổn định, điều đó không có nghĩa là bản thân mô hình không ổn định và dự đoán của nó không chính xác. Nhiều người chỉ quan tâm đến khả năng dự đoán, không thể giải thích được, trong trường hợp đó, đa bạch cầu không phải là vấn đề đáng lo ngại.
Ricardo Cruz

Bạn có thể giải thích Homoscedasticitytốt hơn một chút với một ví dụ? Nó không được rõ. Bạn đã đánh dấu một trong những câu hỏi của tôi là một bản sao mà tôi đang tìm kiếm một cái nhìn tốt hơn về nó. Bạn có thể giải thích?
Sai Kumar
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.