Làm thế nào để kiểm tra sự tự tương quan của phần dư?


23

Tôi có một ma trận với hai cột có nhiều giá (750). Trong hình ảnh bên dưới, tôi đã vẽ các phần dư của hồi quy tuyến tính theo sau:

lm(prices[,1] ~ prices[,2])

Nhìn vào hình ảnh, dường như là một sự tự tương quan rất mạnh của phần dư.

Tuy nhiên, làm thế nào tôi có thể kiểm tra nếu sự tự tương quan của những phần dư đó mạnh? Tôi nên sử dụng phương pháp nào?

Dư lượng của hồi quy tuyến tính

Cảm ơn bạn!


8
Bạn không cần phải kiểm tra tự động. Nó ở đó. Cốt truyện cho thấy điều đó. Bạn có thể nhìn vào hàm tự tương quan của các phần dư (hàm acf()) này, nhưng điều này chỉ đơn giản sẽ xác nhận những gì có thể nhìn thấy bằng mắt thường: mối tương quan giữa các phần dư bị trễ là rất cao.
Wolfgang

@Wolfgang, vâng, đúng, nhưng tôi phải kiểm tra nó bằng lập trình .. Tôi sẽ xem xét chức năng acf. Cảm ơn!
Tweets

@Wolfgang, tôi đang xem acf () nhưng tôi không thấy một loại giá trị p để hiểu nếu có mối tương quan mạnh hay không. Làm thế nào để giải thích kết quả của nó? Cảm ơn
Tweets

Với H0: tương quan (r) = 0, sau đó r theo một dist / normal với trung bình 0 và phương sai của sqrt (số lượng quan sát). Vì vậy, bạn có thể nhận được khoảng tin cậy 95% bằng cách sử dụng +/-qt(0.75, numberofobs)/sqrt(numberofobs)
Jim

@Jim Phương sai của mối tương quan không phải là . Cũng không phải là độ lệch chuẩn . Nhưng nó có một trong đó. n nnn
Glen_b -Reinstate Monica

Câu trả lời:


17

Có lẽ có nhiều cách để làm điều này nhưng cách đầu tiên bạn nghĩ đến là dựa trên hồi quy tuyến tính. Bạn có thể hồi quy các phần dư liên tiếp với nhau và kiểm tra độ dốc đáng kể. Nếu có tương quan tự động, thì nên có một mối quan hệ tuyến tính giữa các phần dư liên tiếp. Để hoàn thành mã bạn đã viết, bạn có thể làm:

mod = lm(prices[,1] ~ prices[,2])
res = mod$res 
n = length(res) 
mod2 = lm(res[-n] ~ res[-1]) 
summary(mod2)

mod2 là một hồi quy tuyến tính của lỗi thời gian , , so với lỗi thời gian , . nếu hệ số cho độ phân giải [-1] là đáng kể, bạn có bằng chứng về sự tự tương quan trong phần dư.ε t t - 1 ε t - 1tεtt-1εt-1

Lưu ý: Điều này mặc nhiên giả định rằng phần dư là tự động theo nghĩa là chỉ là quan trọng khi dự đoán . Trong thực tế có thể có phụ thuộc phạm vi dài hơn. Trong trường hợp đó, phương pháp này tôi đã mô tả nên được hiểu là phép tính gần đúng tự động một độ trễ với cấu trúc tự tương quan thực sự trong . ε t εεt-1εtε


cảm ơn bạn rất nhiều vì ví dụ Chỉ có một nghi ngờ, Làm thế nào tôi có thể kiểm tra nếu res [-1] có ý nghĩa?
Tweets

bạn muốn kiểm tra nó giống như cách bạn sẽ bất kỳ hệ số hồi quy khác - nhìn vào -statistic và -giá trịptp
Macro

thực hiện kiểm tra nhanh với: lm (rnorm (1000) ~ jitter (1: 1000)) Tôi nhận được: Lỗi tiêu chuẩn còn lại: 1.006 trên 997 độ tự do Nhiều bình phương R: 0.0003463, R-bình phương điều chỉnh: -0.0006564 F-statistic : 0,3454 vào ngày 1 và 997 DF, giá trị p: 0,5569 p-giá trị không thể bác bỏ giả thuyết
Dail

Macro, tôi đã kiểm tra các phần dư của biểu đồ mà tôi đã vẽ ở trên và kết quả là: Lỗi tiêu chuẩn dư: 0,04514 trên 747 độ tự do Nhiều bình phương R: 0,9241, Bình phương R đã điều chỉnh: 0,924 Thống kê F: 9093 trên 1 và 747 DF, p-value: <2.2e-16, Nó có vẻ không tốt lắm, Nó rất lạ vì có sự tự kỷ mạnh mẽ, tôi phải làm gì?
Tweets

3
Đây được gọi là xét nghiệm Breusch-Godfrey cho sự tự tương quan.
Charlie

16

Sử dụng thử nghiệm Durbin-Watson , được triển khai trong gói lmtest .

dwtest(prices[,1] ~ prices[,2])

rất lạ tôi nhận được: p-value <2.2e-16, Làm thế nào có thể? dữ liệu có vẻ rất tương quan!
Tweets

4
Giá trị p có lẽ là có được nhiều tương quan như đã quan sát thấy nếu không có tương quan thực sự. Vì vậy, nếu p rất nhỏ, như vậy, điều đó cho thấy có rất nhiều mối tương quan hiện diện trong mẫu.
Rob Hyndman

Bạn có nghĩa là một giá trị p như thế này chỉ ra rằng phần dư rất tự tương quan?
Tweets

hmm lạ, hãy xem: photoshack.us/f/59/17671620.png làm sao có thể hình ảnh bên phải không bị tự động?
Tweets

: dail Có vẻ như hình ảnh bên trái có sự thay đổi về cấu trúc (xem bài viết "Outliers, Level Shifts, and Variace Change in Time Series" của tạp chí Ruey Tsay), Tạp chí Dự báo, VOl 7, 1-20 (1988) để biết chi tiết) trong trường hợp này không "nhầm lẫn" DW có lẽ do thực tế toàn bộ phân phối vẫn bình thường trong khi hình ảnh bên phải có một số dị thường rõ ràng (và có thể nhận dạng bằng thực nghiệm) tạo ra một hình ảnh không bình thường (leptokurtotic xem wikopedia: Một bản phân phối với sự dư thừa dương tính được gọi là phân phối leptokurtic) gây ra sự tàn phá với DW
IrishStat

11

Kiểm tra DW hoặc kiểm tra hồi quy tuyến tính không mạnh đối với sự bất thường trong dữ liệu. Nếu bạn có Xung, Xung theo mùa, Chuyển dịch theo cấp độ hoặc Xu hướng thời gian cục bộ thì các thử nghiệm này đều vô dụng vì các thành phần không được xử lý này làm tăng phương sai của các lỗi do đó làm sai lệch các thử nghiệm khiến bạn (như bạn đã phát hiện ra) không chấp nhận giả thuyết không tự động tương quan. Trước hai thử nghiệm này hoặc bất kỳ thử nghiệm tham số nào khác mà tôi biết có thể được sử dụng, người ta phải "chứng minh" rằng giá trị trung bình của phần dư không khác biệt đáng kể về mặt thống kê so với 0,0 MỌI THỨ nếu không các giả định cơ bản là không hợp lệ. Người ta biết rằng một trong những hạn chế của thử nghiệm DW là giả định rằng các lỗi hồi quy thường được phân phối. Lưu ý phương tiện phân phối thông thường trong số những thứ khác: Không có bất thường (xemhttp://homepage.newschool.edu/~canjels/permdw12.pdf ). Ngoài ra, thử nghiệm DW chỉ kiểm tra độ tương quan tự động của độ trễ 1. Dữ liệu của bạn có thể có hiệu ứng hàng tuần / theo mùa và điều này sẽ không được chẩn đoán và hơn nữa, không được xử lý, sẽ làm sai lệch thử nghiệm DW.


các xét nghiệm để kiểm tra rằng phần dư khác nhau đáng kể so với không là gì? Nếu hồi quy bao gồm đánh chặn, thì giá trị trung bình còn lại là đại số 0, vì vậy tôi tò mò làm thế nào có thể phá vỡ vấn đề này.
mpiktas

: mpkitas Như bạn đã nói khi bạn bao gồm một hằng số, giá trị trung bình của các lỗi được đảm bảo là 0,0 nhưng điều đó không đảm bảo rằng giá trị trung bình của các lỗi là Không ở mọi nơi. Ví dụ: nếu một chuỗi có thay đổi về giá trị trung bình, giá trị trung bình tổng thể sẽ là một hằng số nhưng sẽ mang lại tw0 "cụm" dư, mỗi nhóm có một giá trị trung bình khác nhau. Bạn có thể theo đuổi bài viết "Các ngoại lệ, thay đổi cấp độ và thay đổi phương sai trong chuỗi thời gian" của Ruey Tsay, Tạp chí Dự báo, VOl 7, 1-20 (1988) để biết chi tiết. HOẶC faculty.chicagobooth.edu/ruey.tsay/teaching/uts/lec10-08.pdf HOẶC Google "phát hiện can thiệp tự động"
IrishStat

1
Đây chỉ là giả định "không có biến bị bỏ qua" tiêu chuẩn tiềm ẩn trong tất cả các phân tích hồi quy.
Charlie
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.