Giả định chuẩn trong hồi quy tuyến tính


11

Như một giả định của hồi quy tuyến tính, tính quy phạm của phân phối lỗi đôi khi bị "mở rộng" sai hoặc được hiểu là sự cần thiết của tính chuẩn của y hoặc x.

Có thể xây dựng một kịch bản / tập dữ liệu trong đó X và Y không bình thường nhưng thuật ngữ lỗi là do đó các ước tính hồi quy tuyến tính thu được là hợp lệ?


5
Ví dụ tầm thường: X có phân phối Bernoulli (nghĩa là lấy các giá trị 0 hoặc 1); Y = X + N (0, 0,1). Cả X và Y thường không được phân phối riêng, nhưng hồi quy Y trên X vẫn hoạt động.
Hồng Ooi

Tôi đoán bạn đang nghĩ về việc phân phối phần dư chứ không phải phân phối các biến.
tashuhka


Câu trả lời:


16

Mở rộng trên bình luận của Hong Oois với một hình ảnh. Dưới đây là hình ảnh của một tập dữ liệu trong đó không có phần nào được phân phối bình thường nhưng phần dư vẫn còn, do đó các giả định của hồi quy tuyến tính vẫn còn hiệu lực:

nhập mô tả hình ảnh ở đây

Hình ảnh được tạo bởi mã R sau:

library(psych)
x <- rbinom(100, 1, 0.3)
y <- rnorm(length(x), 5 + x * 5, 1)

scatter.hist(x, y, correl=F, density=F, ellipse=F, xlab="x", ylab="y")
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.