Hồi quy có hoạt động trên dữ liệu thường không được phân phối không?


8

biểu đồ dữ liệu của tôi

Tôi đang cố gắng xem liệu các biến x và y cùng nhau hay riêng biệt ảnh hưởng đáng kể đến Q_7 (biểu đồ cho ở trên). Tôi đã chạy thử nghiệm tính chất bình thường của Shapiro-Wilk và nhận được những điều sau đây

shapiro.test(Q_7)
## data:  Q_7
## W = 0.68439, p-value < 2.2e-16

Với phân phối này, hồi quy sau sẽ làm việc? Hoặc có một thử nghiệm khác tôi nên làm?

lm(Q_7 ~ x*y)

7
kiểm tra số dư, không phải dữ liệu
12:51

Hãy thử chuyển đổi log Q_7. Tại thời điểm này, nó rất sai lệch. Kiểm tra sự phân phối của các yếu tố dự đoán là tốt.
Joe

1
Tra cứu Định lý Gauss Markov.
G. Grothendieck

Hãy thử với chuyển đổi căn bậc hai. Nếu bạn có nhiều số không, chuyển đổi nhật ký có thể không hoạt động tốt. Ngoài ra, vì bạn đang xử lý số đếm, hồi quy nhị thức âm Poisson là lựa chọn tự nhiên hơn.
utobi

1
"Không dữ liệu" có nghĩa là gì?
Cá bạc

Câu trả lời:


17

y=Xβ+ε
Xyβεεyy|Xεy

yεεε^= =y-Xβ^β^ε^εε


Đây là một bản tóm tắt tốt về các công cụ tiêu chuẩn nhưng dường như bỏ lỡ một tính năng chính của câu hỏi này, đó là với một câu trả lời sai lệch nhưng khác không, hình thức chức năng này không chắc là một ý tưởng tốt. Để tránh những dự đoán tiêu cực, và trên cơ sở khác, hồi quy Poisson có vẻ là điểm khởi đầu tốt hơn.
Nick Cox

8

Câu trả lời ngắn gọn là có.

yXε

lmYX

  • E[ε|X]= =0
  • Vmộtr(ε)<

Nếu bạn tiếp tục đưa ra giả định rằng phần dư của bạn không tương quan và tất cả chúng đều có cùng phương sai, thì định lý Gauss-Markov được áp dụng và OLS là công cụ ước lượng không thiên vị tuyến tính tốt nhất (BLUE).

Nếu phần dư của bạn có tương quan hoặc có phương sai khác nhau, thì OLS vẫn hoạt động nhưng nó có thể kém chính xác hơn, điều này phải được phản ánh trong cách bạn báo cáo khoảng tin cậy của các ước tính của bạn (sử dụng, giả sử các lỗi tiêu chuẩn mạnh ).

Nếu bạn cũng đưa ra giả định rằng phần dư của bạn được phân phối bình thường, thì OLS trở nên hiệu quả không có triệu chứng vì nó tương đương với khả năng tối đa.

Vì vậy, hồi quy có thể hoạt động tốt hơn nếu dữ liệu của bạn được phân phối bình thường, nhưng nó vẫn hoạt động nếu không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.