Làm thế nào để thêm thành phần định kỳ vào mô hình hồi quy tuyến tính?


17

Tôi có một số dữ liệu tần số tích lũy. Một dòng vẻ như rất phù hợp với dữ liệu, nhưng có sự uốn lượn theo chu kỳ / định kỳ trong dòng. Tôi muốn ước tính khi tần số tích lũy sẽ đạt đến một giá trị nhất định . Khi tôi vẽ các phần dư so với các giá trị được trang bị, tôi có một hành vi hình sin đẹp.y=ax+bc

Bây giờ, để thêm một biến chứng khác, lưu ý rằng trong các ô dư

văn bản thay thế

có hai chu kỳ có giá trị thấp hơn các chu kỳ khác, điều này thể hiện hiệu ứng cuối tuần cũng phải được tính đến.

Vậy, tôi sẽ đi đâu từ đây? Làm cách nào tôi có thể kết hợp một số thuật ngữ cosine, sin hoặc chu kỳ vào mô hình hồi quy để xấp xỉ. ước tính khi tần số tích lũy sẽ bằng ?c

Câu trả lời:


9

Bạn có thể thử stl()phương pháp tuyệt vời - nó phân hủy (sử dụng loess()khớp lặp ) thành xu hướng và theo mùa và phần còn lại. Điều này có thể chỉ nhận các dao động của bạn ở đây.


8

Nếu bạn biết tần số dao động, bạn có thể bao gồm hai yếu tố dự đoán bổ sung là sin (2π wt) và cos (2π wt) - đặt w để có bước sóng mong muốn - và điều này sẽ mô hình hóa dao động. Bạn cần cả hai thuật ngữ để phù hợp với biên độ và góc pha. Nếu có nhiều hơn một tần số, bạn sẽ cần một thuật ngữ sin và cos cho mỗi tần số.

Nếu bạn không biết tần số là gì, cách tiêu chuẩn để cách ly nhiều tần số là tách dữ liệu (lấy phần dư từ mức phù hợp tuyến tính, như bạn đã thực hiện) và chạy biến đổi Fourier rời rạc so với phần dư. Một cách nhanh chóng và bẩn thỉu để làm điều này là trong MS-Excel, có công cụ Phân tích Fourier trong Bổ trợ Phân tích Dữ liệu. Chạy phân tích so với phần dư, lấy giá trị tuyệt đối của các biến đổi và biểu đồ thanh kết quả. Các đỉnh sẽ là các thành phần tần số chính mà bạn muốn mô hình hóa.

Khi bạn thêm các công cụ dự đoán theo chu kỳ này, hãy chú ý đến giá trị p của chúng trong hồi quy của bạn và không quá phù hợp. Chỉ sử dụng những tần số có ý nghĩa thống kê. Thật không may, điều này có thể làm cho việc phù hợp với tần số thấp một chút khó khăn.


2
Khi bạn ước tính tần số từ dữ liệu (như với phân tích Fourier) và sau đó đưa chúng vào dưới dạng các thuật ngữ sin / cos trong hồi quy, giá trị p của chúng sẽ vô nghĩa.
whuber

4

Hãy bắt đầu bằng cách quan sát rằng các ô vuông nhỏ nhất thông thường phù hợp với những dữ liệu này có thể không phù hợp. Nếu dữ liệu cá nhân được lũy kế được giả định, như thường lệ, có các thành phần sai số ngẫu nhiên, sau đó các lỗi trong các dữ liệu tích lũy ( không những tần số tích lũy --that của một cái gì đó khác với những gì bạn có) là tổng tích lũy của tất cả các điều khoản lỗi. Điều này làm cho dữ liệu tích lũy không đồng nhất (chúng ngày càng biến đổi theo thời gian) và có mối tương quan tích cực mạnh mẽ. Bởi vì những dữ liệu này được xử lý thường xuyên và có rất nhiều trong số chúng, có rất ít vấn đề với sự phù hợp bạn sẽ nhận được, nhưng ước tính của bạn về các lỗi, dự đoán của bạn (đó là tất cả những gì câu hỏi) và đặc biệt là các lỗi dự đoán tiêu chuẩn của bạn có thể được bỏ qua.

Một quy trình chuẩn để phân tích dữ liệu đó bắt đầu với các giá trị ban đầu. Lấy sự khác biệt hàng ngày để loại bỏ thành phần hình sin tần số cao hơn. Lấy sự khác biệt hàng tuần của những người đó để loại bỏ một chu kỳ hàng tuần có thể. Phân tích những gì còn lại. Mô hình ARIMA là một cách tiếp cận linh hoạt mạnh mẽ, nhưng bắt đầu đơn giản: vẽ biểu đồ cho những dữ liệu khác biệt đó để xem những gì đang diễn ra, sau đó tiếp tục từ đó. Cũng lưu ý rằng, với ít hơn hai tuần dữ liệu, ước tính của bạn về chu kỳ hàng tuần sẽ kém và sự không chắc chắn này sẽ chi phối sự không chắc chắn trong các dự đoán.


2

Rõ ràng dao động chi phối có thời gian một ngày. Có vẻ như cũng có các thành phần tần số thấp hơn liên quan đến ngày trong tuần, vì vậy hãy thêm một thành phần có tần suất một tuần (tức là một phần bảy của một ngày) và một vài sóng hài đầu tiên. Điều đó đưa ra một mô hình của mẫu:

E(y)= =c+một0cos(2πt)+b0tội(2πt)+một1cos(2πt/7)+b1tội(2πt/7)+một2cos(4πt/7)+b2tội(4πt/7)+Giáo dục

- giả định tđược đo bằng ngày. Đâyylà dữ liệu thô , không phải là tổng tích lũy của nó.


-2

Tại sao không sử dụng GA để tìm biên độ, chu kỳ và pha của chuỗi Sine (hoặc cosine) một cách tuần tự, sau đó kết hợp. Tối ưu hóa các mục sau: (n (n-1) / ((np-1) ^ 2 (np-2))) RSS


1
Không rõ làm thế nào điều này trả lời câu hỏi về tính toán một hàm tần số tích lũy nghịch đảo. Và ý nghĩa của "GA" là gì? Thuật toán di truyền? Thứ gì khác?
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.