Để nói trước điều này, tôi có một nền tảng toán học khá sâu sắc, nhưng tôi chưa bao giờ thực sự xử lý chuỗi thời gian hay mô hình thống kê. Vì vậy, bạn không cần phải rất dịu dàng với tôi :)
Tôi đang đọc bài viết này về mô hình sử dụng năng lượng trong các tòa nhà thương mại và tác giả đưa ra tuyên bố này:
[Sự hiện diện của autocorrelation phát sinh] bởi vì mô hình đã được phát triển từ dữ liệu chuỗi thời gian sử dụng năng lượng, vốn đã tự động tương quan. Bất kỳ mô hình xác định thuần túy nào cho dữ liệu chuỗi thời gian sẽ có tự động tương quan. Tự động tương quan được tìm thấy để giảm nếu [nhiều hệ số Fourier] được đưa vào mô hình. Tuy nhiên, trong hầu hết các trường hợp, mô hình Fourier có CV thấp, do đó, mô hình có thể được chấp nhận cho các mục đích thực tế không (sic) không đòi hỏi độ chính xác cao.
0.) "Bất kỳ mô hình xác định thuần túy nào cho dữ liệu chuỗi thời gian sẽ có tự động tương quan" nghĩa là gì? Tôi có thể mơ hồ hiểu điều này có nghĩa là gì - ví dụ, làm thế nào bạn mong đợi để dự đoán điểm tiếp theo trong chuỗi thời gian của bạn nếu bạn có 0 tự động tương quan? Đây không phải là một đối số toán học, để chắc chắn, đó là lý do tại sao đây là 0 :)
1.) Tôi có ấn tượng rằng sự tự tương quan về cơ bản đã giết chết mô hình của bạn, nhưng nghĩ về nó, tôi không thể hiểu tại sao điều này lại xảy ra. Vậy tại sao autocorrelation là một điều xấu (hoặc tốt)?
2.) Giải pháp tôi đã nghe nói để xử lý sự tự tương quan là làm khác đi chuỗi thời gian. Nếu không cố gắng đọc suy nghĩ của tác giả, tại sao người ta sẽ không làm khác đi nếu sự tự kỷ không đáng kể tồn tại?
3.) Những hạn chế nào đối với tự động tương quan không đáng kể đặt trên một mô hình? Đây có phải là một giả định ở đâu đó (nghĩa là phần dư được phân phối bình thường khi mô hình hóa với hồi quy tuyến tính đơn giản)?
Dù sao, xin lỗi nếu đây là những câu hỏi cơ bản, và cảm ơn trước vì đã giúp đỡ.