Làm thế nào để biết nếu phần dư được tự động tương thích từ một đồ họa


11

Khi bạn thực hiện hồi quy OLS và vẽ các phần dư kết quả, làm thế nào bạn có thể biết liệu phần dư có tự động tương quan không? Tôi biết có những thử nghiệm cho điều này (Durbin, Breusch-Godfrey) nhưng tôi đã tự hỏi liệu bạn có thể nhìn vào một âm mưu để đánh giá xem liệu tự tương quan có thể là một vấn đề không (vì đối với dị năng thì khá dễ thực hiện).

Câu trả lời:


12

Bạn không chỉ có thể nhìn vào một cốt truyện, tôi nghĩ nó thường là một lựa chọn tốt hơn. Kiểm định giả thuyết trong tình huống này trả lời câu hỏi sai.

Biểu đồ thông thường để xem xét sẽ là một hàm tự tương quan (ACF) của phần dư.

Hàm autocorrelation là mối tương quan của phần dư (dưới dạng chuỗi thời gian) với độ trễ của chính nó.

Ví dụ, đây là ACF của phần dư từ một ví dụ nhỏ từ Montgomery et al

ACF của phần dư cho doanh số nước giải khát

Một số tương quan mẫu (ví dụ ở độ trễ 1,2 và 8) không đặc biệt nhỏ (và do đó có thể ảnh hưởng đáng kể đến mọi thứ), nhưng chúng cũng không thể được nói từ ảnh hưởng của tiếng ồn (mẫu rất nhỏ).

Chỉnh sửa: Đây là một âm mưu để minh họa sự khác biệt giữa một loạt không tương quan và một loạt tương quan cao (trên thực tế, một loạt không cố định)

Tiếng ồn trắng và bước đi ngẫu nhiên

Âm mưu trên là tiếng ồn trắng (độc lập). Cái thấp hơn là một bước đi ngẫu nhiên (có sự khác biệt là loạt gốc) - nó có sự tự tương quan rất mạnh.


1
Cảm ơn câu trả lời. Khi bạn nhìn vào các ô trên wiki ( en.wikipedia.org/wiki/File:Acf_new.svg ), bạn có thể cho biết từ âm mưu phía trên (không phải âm mưu ACF) rằng phần dư được tự động hóa không?
John Doe

Tôi sẽ nói "hmm, trông có vẻ chu kỳ ... có thể là tự tương quan, có thể không. ACF trông như thế nào?"
Glen_b -Reinstate Monica

1
Được rồi, nhưng bạn có thể giải thích thêm về điều đó: Ví dụ: tôi đã tìm thấy câu hỏi này: stats.stackexchange.com/questions/14914/ nam Rõ ràng, có tự động tương quan. Điều gì đặc biệt tôi đang tìm kiếm để đi đến kết luận này?
John Doe

Chắc chắn, điều đó cho thấy một cái gì đó sẽ tạo ra sự tương quan tích cực (mặc dù tôi có thể đặt nó xuống theo xu hướng cũng như phụ thuộc vào xu hướng). Xem xét - nếu các quan sát là độc lập, thì hãy nghĩ về khả năng một chuỗi dài của chúng sẽ ở một bên của giá trị trung bình hoặc bên kia, không có gì ở phía đối diện. Tôi nghĩ rằng tùy chọn đầu tiên tốt nhất là mô phỏng dữ liệu được tự động tương thích ở nhiều cấp độ khác nhau và xem xét nó.
Glen_b -Reinstate Monica

1
Tôi nhận được rằng bạn không có tự động tương quan khi dữ liệu chỉ được phân phối ngẫu nhiên. Nhưng với tư cách là một chỉ báo cho tự động tương quan, liệu có đủ khi dữ liệu không được phân phối ngẫu nhiên hay bạn là một kiểu mẫu (ví dụ: một điểm dữ liệu có giá trị cao được theo sau bởi nhiều điểm dữ liệu có giá trị cao)?
John Doe

1

Không có gì bất thường nếu 5% hoặc ít hơn các giá trị tự tương quan nằm ngoài các khoảng vì điều đó có thể là do biến thể lấy mẫu. Một thực tế là tạo ra biểu đồ tự tương quan cho 20 giá trị đầu tiên và kiểm tra xem có nhiều hơn một giá trị nằm ngoài các khoảng cho phép hay không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.