Ai đó có thể giải thích chức năng tự tương quan trong dữ liệu chuỗi thời gian không? Áp dụng acf vào dữ liệu, ứng dụng sẽ là gì?
Ai đó có thể giải thích chức năng tự tương quan trong dữ liệu chuỗi thời gian không? Áp dụng acf vào dữ liệu, ứng dụng sẽ là gì?
Câu trả lời:
Không giống như dữ liệu lấy mẫu thông thường, dữ liệu chuỗi thời gian được sắp xếp. Do đó, có thêm thông tin về mẫu của bạn mà bạn có thể tận dụng, nếu có các mẫu thời gian hữu ích. Hàm autocorrelation là một trong những công cụ được sử dụng để tìm các mẫu trong dữ liệu. Cụ thể, hàm tự tương quan cho bạn biết mối tương quan giữa các điểm cách nhau bởi độ trễ thời gian khác nhau. Ví dụ, đây là một số giá trị hàm acf có thể có cho một chuỗi với các khoảng thời gian riêng biệt:
Ký hiệu là ACF (n = số khoảng thời gian giữa các điểm) = tương quan giữa các điểm cách nhau bởi n khoảng thời gian. Ill đưa ra ví dụ cho một vài giá trị đầu tiên của n.
ACF (0) = 1 (tất cả dữ liệu tương quan hoàn hảo với chính chúng), ACF (1) =. 9 (tương quan giữa một điểm và điểm tiếp theo là 0,9), ACF (2) =. 4 (tương quan giữa một điểm và một điểm hai bước thời gian phía trước là 0,4) ... vv.
Vì vậy, ACF cho bạn biết các điểm tương quan với nhau như thế nào, dựa trên số lượng thời gian chúng được phân tách. Đó là ý chính của tự tương quan, đó là cách các điểm dữ liệu trong quá khứ tương quan với các điểm dữ liệu trong tương lai, cho các giá trị khác nhau của sự phân tách thời gian. Thông thường, bạn mong muốn hàm tự tương quan giảm xuống 0 khi các điểm trở nên tách biệt hơn (nghĩa là n trở nên lớn trong ký hiệu trên) vì thường khó dự đoán hơn về tương lai từ một tập hợp dữ liệu nhất định. Đây không phải là một quy tắc, nhưng là điển hình.
Bây giờ, đến phần thứ hai ... tại sao chúng ta quan tâm? ACF và chức năng chị em của nó, một phầnchức năng tự tương quan (nhiều hơn một chút), được sử dụng trong phương pháp mô hình hóa Box-Jenkins / ARIMA để xác định các điểm dữ liệu trong quá khứ và tương lai có liên quan như thế nào trong một chuỗi thời gian. Hàm tự tương quan một phần (PACF) có thể được coi là mối tương quan giữa hai điểm được phân tách bằng một số giai đoạn n, NHƯNG với hiệu ứng của các mối tương quan can thiệp được loại bỏ. Điều này rất quan trọng vì cho phép trong thực tế, mỗi điểm dữ liệu chỉ tương quan trực tiếp với điểm dữ liệu NEXT và không có điểm nào khác. Tuy nhiên, nó sẽ xuất hiện như thể điểm hiện tại có tương quan với các điểm xa hơn trong tương lai, nhưng chỉ do hiệu ứng loại "phản ứng dây chuyền", tức là, T1 có tương quan trực tiếp với T2 tương quan trực tiếp với T3, do đó, nó NHÌN T1 tương quan trực tiếp với T3. PACF sẽ loại bỏ mối tương quan can thiệp với T2 để bạn có thể nhận ra các mẫu tốt hơn. Một đoạn giới thiệu hay cho điều này làđây.
Cẩm nang Thống kê Kỹ thuật NIST, trực tuyến, cũng có một chương về điều này và một ví dụ phân tích chuỗi thời gian bằng cách sử dụng tự động tương quan và tự tương quan một phần. Tôi sẽ không tái tạo nó ở đây, nhưng đi qua nó và bạn sẽ hiểu rõ hơn về tự kỷ.
Hãy để tôi cung cấp cho bạn một quan điểm khác.
vẽ các giá trị bị trễ của một chuỗi thời gian với các giá trị hiện tại của chuỗi thời gian.
nếu biểu đồ bạn thấy là tuyến tính, có nghĩa là có sự phụ thuộc tuyến tính giữa các giá trị hiện tại của chuỗi thời gian so với các giá trị bị trễ của chuỗi thời gian.
giá trị tự tương quan là cách rõ ràng nhất để đo lường tính tuyến tính của sự phụ thuộc đó.