Dự báo chuỗi thời gian không cố định


8

Tôi muốn dự báo chuỗi thời gian không cố định, liên quan đến một số giả định quan trọng của a-prori sau khi nghiên cứu về các trường hợp của chuỗi đó.

  1. Tôi đã xây dựng hàm phân phối xác suất một điểm trung bình theo thời gian xấp xỉ bằng phân phối chuẩn. Từ quan điểm này, tôi muốn dự báo không vượt quá điều này khi . Nói cách khác, phương sai của phải được giới hạn.zt(l)lzt(l)

    p^(x)= =12πσ2điểm kinh nghiệm(-x22σ2)
    zt(tôi)tôizt(tôi)
  2. Hàm phân phối xác suất hai điểm trung bình cũng đã được xây dựng, dẫn đến việc xác định hàm tự tương quan. được cung cấp .ρ(j)Mộtj-α0<α<0,5p^(xTôi,Tôi;xj,j)ρ(j)Mộtj-α0<α<0,5

Lúc đầu, quá trình nhận dạng Box-Jenkins đã đưa tôi đến mô hình , tuy nhiênMộtRTôiMMột(0,1,3)

  1. Tôi không thể giới hạn phương sai cho đến khi (xuất phát từ các phương trình cho trọng số BJ ). Đồng thời, tôi không thể sử dụng vì hiện tượng tự tương quan ban đầu giảm chậm (có lẽ là bằng chứng của việc không cố định theo BJ). Đây là trở ngại chính đối với tôi.ψ j d = 0d0ψjd= =0

  2. Trực quan, mô phỏng không trùng khớp với hành vi của các mẫu của tôi. Và mối tương quan của sự khác biệt đầu tiên của loạt là trong thỏa thuận xấu với mối tương quan sau mô hình.MộtRTôiMMột(0,1,3)

  3. Phân tích phần dư cho thấy mối tương quan đáng kể bắt đầu độ trễ 3. Đây là lý do tại sao tuyên bố ban đầu của tôi về là không chính xác.MộtRTôiMMột(0,1,3)

Cố gắng phù hợp với các mô hình nhau, tôi thấy rằng có mối tương quan dư đáng kể gần với độ trễ cho mỗi . Có thể giả sử rằng tôi cần mô hình (như giới hạn lựa chọn), ví dụ ARIMA phân đoạn.p p A R I M A ( , 0 , q )MộtRTôiMMột(p,0,0)ppMộtRTôiMMột(,0,q)

Từ [1] Tôi đã tìm hiểu về các mô hình phân đoạn có hiệu lực .A R I M A ( , 0 , q )MộtRTôiMMột(p,d,q)MộtRTôiMMột(,0,q)

  1. Tôi đã không tìm thấy bất kỳ gói GNU R nào có hỗ trợ các giá trị bị thiếu cho việc này. Thiếu giá trị dường như là một loại thách thức.

  2. Các ấn phẩm về ARIMA phân đoạn là khá hiếm. Là mô hình phân số như vậy thực sự được sử dụng? Có lẽ có một sự thay thế tốt của các mô hình ARIMA cho nhu cầu của tôi? Dự báo không phải là chính của tôi, tôi chỉ có lợi ích thực tế.

  3. Từ các tài liệu khác nhau (ví dụ [2]), tôi đã học được rằng thực tế không thể quyết định giữa ARIMA phân đoạn và các mô hình có "thay đổi cấp độ". Tuy nhiên, tôi chưa tìm thấy gói cho GNU R để phù hợp với các mô hình 'mức độ dịch chuyển'.

[1]: Granger, Joyeux.: J. của chuỗi thời gian hậu môn. tập. 1 không 1 1980, tr.15

[2]: Grassi, de Magistris.: "Khi bộ nhớ dài gặp bộ lọc Kalman: Một nghiên cứu so sánh", Phân tích dữ liệu và thống kê tính toán, 2012, trên báo chí.

Cập nhật: để hiển thị tiến trình của riêng tôi và trả lời @IrishStat

Tuyên bố của tôi về phân phối xác suất hai điểm nói chung là không chính xác. Xây dựng theo cách này chức năng sẽ phụ thuộc vào chiều dài loạt đầy đủ. Vì vậy, có một chút để trích xuất từ ​​điều này. Ít nhất, tham số có tên sẽ phụ thuộc vào độ dài chuỗi đầy đủ.α

Danh sách 2 và 3 cũng đã được cập nhật.

Dữ liệu của tôi có sẵn như là tập tin dat ở đây .

Tại thời điểm hiện tại, tôi nghi ngờ giữa FARIMA và thay đổi cấp độ và tôi vẫn không thể tìm thấy phần mềm phù hợp để kiểm tra các tùy chọn này. Đây cũng là trải nghiệm đầu tiên của tôi với nhận dạng mô hình, vì vậy mọi trợ giúp sẽ được đánh giá cao.


Tôi có một chút bối rối bởi dữ liệu của bạn. Ví dụ: ý nghĩa của 6325.76 ... và -.247831 là gì. Điều gì đang được quan sát? Dữ liệu theo thời gian và cách đều nhau trong thời gian? 6.325,76666666667 -,247831949032426 "770" 6.326,78333333333 ,0282060159445925 "771" 6.327,78333333333 ,162348034962085 "772" 6.328,78333333333 -,206057978534193 "773" 6.329,78333333333 -,427928912063427 "774" 6.330,78333333333 NA "775" 6.331,78333333333 NA "776" 6.332,78333333333 NA "777" 6.333,78333333333 NA "778" 6.334,78333333333 NA
IrishStat

Đây là kết quả write.table (). Cột đầu tiên là "tên hàng" (vô nghĩa), thứ hai là thời điểm, giá trị thứ ba. Chúng là những quan sát gần như cách đều nhau, rất nhiều dữ liệu bị bỏ sót.
0x2207

Phương pháp tiếp cận miền thời gian yêu cầu dữ liệu cách đều nhau KHÔNG CÓ giá trị thiếu. Đối với các mục đích sư phạm, tôi sẽ lấy một tập hợp con của dữ liệu VÀ giả sử rằng nó cách đều nhau và cố gắng mô tả nó.
IrishStat

Câu trả lời:


5

Tôi chưa bao giờ thấy một mô hình như quy trình nhận dạng Box-Jenkins dẫn tôi đến mô hình ARIMA (0,1,3) NHƯNG tôi chưa bao giờ thấy một con thiên nga đen cho đến khi tôi đến Úc. Vui lòng gửi dữ liệu của bạn vì nó có thể gợi ý sự cần thiết cho

  1. Phát hiện can thiệp dẫn đến thay đổi mức độ, xu hướng thời gian địa phương et al
  2. Thông số thời gian khác nhau
  3. Phương sai sai thời gian

Nếu dữ liệu của bạn là bí mật, chỉ cần mở rộng nó.

OK đã nhận được dữ liệu của bạn (khoảng 80000 bài đọc), tôi đã chọn 805 quan sát bắt đầu từ điểm 6287 và thu được.

nhập mô tả hình ảnh ở đây. Một điểm thay đổi đáng kể đã được phát hiện ở giai đoạn 137 cho thấy các tham số thay đổi theo thời gian. Các quan sát 668 còn lại cho thấy Mô hình ARIMA pdq (3,0,0) với mức độ thay đổi. Bước hỗ trợ cho kết luận sơ bộ của bạn về độ trễ 3 nhập mô tả hình ảnh ở đây.. Biểu đồ thực tế / phù hợp / dự báo là nhập mô tả hình ảnh ở đâyLô dư nhập mô tả hình ảnh ở đâyvà acf của phần dư là nhập mô tả hình ảnh ở đây. Vì acf của phần dư cho thấy cấu trúc mạnh ở giai đoạn 5 và 10, nhập mô tả hình ảnh ở đâybạn có thể điều tra thêm về cấu trúc theo mùa ở độ trễ 5. Tôi hy vọng điều này sẽ giúp ích.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.