Nhược điểm của mô hình không gian nhà nước và Bộ lọc Kalman cho mô hình chuỗi thời gian là gì?

53

Với tất cả các đặc tính tốt của mô hình không gian trạng thái và KF, tôi tự hỏi - những bất lợi của mô hình hóa không gian trạng thái và sử dụng Bộ lọc Kalman (hoặc EKF, UKF hoặc bộ lọc hạt) để ước tính là gì? Trên giả sử các phương pháp thông thường như ARIMA, VAR hoặc phương pháp ad-hoc / heuristic.

Họ có khó để hiệu chỉnh? Chúng có phức tạp và khó để thấy sự thay đổi trong cấu trúc của một mô hình sẽ ảnh hưởng đến dự đoán như thế nào không?

Hoặc, đặt một cách khác - những lợi thế của ARIMA, VAR thông thường so với các mô hình không gian nhà nước là gì?

Tôi chỉ có thể nghĩ về lợi thế của mô hình không gian nhà nước:

Nó dễ dàng xử lý các ngắt cấu trúc, dịch chuyển, các tham số thay đổi theo thời gian của một số mô hình tĩnh - chỉ cần làm cho các tham số đó trạng thái động của mô hình và mô hình không gian trạng thái sẽ tự động điều chỉnh theo bất kỳ dịch chuyển nào trong tham số;
Nó xử lý dữ liệu bị thiếu rất tự nhiên, chỉ cần thực hiện bước chuyển đổi của KF và không thực hiện bước cập nhật;
Nó cho phép thay đổi các tham số nhanh chóng của chính mô hình không gian trạng thái (hiệp phương sai và ma trận chuyển tiếp / quan sát) vì vậy nếu quan sát hiện tại của bạn đến từ một nguồn khác ít so với các nguồn khác - bạn có thể dễ dàng kết hợp nó vào ước tính mà không cần thực hiện bất cứ điều gì đặc biệt;
Sử dụng các thuộc tính trên, nó cho phép dễ dàng xử lý dữ liệu có khoảng cách không đều: thay đổi mô hình mỗi lần theo khoảng thời gian giữa các lần quan sát hoặc sử dụng khoảng thời gian thông thường và xử lý các khoảng mà không quan sát là dữ liệu bị thiếu;
Nó cho phép sử dụng dữ liệu từ các nguồn khác nhau đồng thời trong cùng một mô hình để ước tính một đại lượng cơ bản;
Nó cho phép để xây dựng một mô hình từ nhiều interpretable thành phần năng động không quan sát được và ước tính họ;
Bất kỳ mô hình ARIMA nào cũng có thể được biểu diễn dưới dạng không gian trạng thái, nhưng chỉ các mô hình không gian trạng thái đơn giản mới có thể được biểu diễn chính xác ở dạng ARIMA.

— Ketede
nguồn

1

JFew lợi thế bổ sung, như đã lưu ý ở điểm đầu tiên của bạn, có thể dễ dàng kết hợp nhiều thay đổi cấp độ và ngoại lệ. Theo kinh nghiệm của tôi, phá vỡ cấu trúc có thể dễ dàng được xác định với không gian trạng thái hơn ARIMA. Cũng có thể dễ dàng kết hợp các hiệu ứng phi tuyến của các biến ngoại sinh. Không yêu cầu dữ liệu chuỗi thời gian là ổn định, đó là một + lớn.

— dự báo

2

Vâng, tôi sẽ đưa các mô hình không gian nhà nước qua ARIMA bất cứ lúc nào. Tôi có thể nghĩ về hai nhược điểm (sắp xếp): a) mô hình không gian trạng thái tương ứng của mô hình ARIMA có rất nhiều số không cần thiết trong ma trận thiết kế. Người ta có thể lập luận rằng ARIMA nhỏ gọn hơn. b) có các mô hình phi tuyến tính / phi gaussian hiếm khi có các dạng phân tích đôi khi có thể được mô tả dưới dạng ARIMA, nhưng sẽ khó khăn trong không gian trạng thái truyền thống.

— Cagdas Ozgenc 4/12/13

2

@Kochede Durbin và Koopman dường như cũng không thể nghĩ ra nhiều nhược điểm - họ đã đề cập đến hai ở cuối trang 52 trong sách giáo khoa tuyệt vời của họ . Và tôi muốn nói rằng những bất lợi này không nhất thiết phải đúng nữa.

2

Một số câu hỏi . Liệu nó có xác định rõ ràng thay đổi xu hướng thời gian và báo cáo các điểm trong thời gian mà xu hướng thay đổi? Có phân biệt giữa thay đổi tham số và thay đổi phương sai lỗi và báo cáo về điều này? Nó có phát hiện và báo cáo về các hiệu ứng chì và lag cụ thể xung quanh các yếu tố dự đoán do người dùng chỉ định không? Người ta có thể chỉ định số lượng giá trị tối thiểu trong một nhóm trước khi xu hướng thay đổi mức / thời gian cục bộ được khai báo không? Liệu nó có phân biệt giữa nhu cầu biến đổi công suất so với các điểm xác định trong thời gian mà phương sai lỗi thay đổi không? Các mô hình ARMAX nói lên tất cả những cân nhắc này.

— IrishStat

1

Để hoàn thiện, một bất lợi trong một số trường hợp là bạn phải giải thích chúng. Điều đó phụ thuộc vào khán giả của bạn. Tôi rất vui nếu bất cứ ai muốn loại bỏ điều này như một cái gì đó, hoặc nên, không liên quan đến việc lựa chọn một kỹ thuật.

— Nick Cox

25

Dưới đây là một số danh sách sơ bộ về những nhược điểm tôi có thể rút ra từ ý kiến của bạn. Phê bình và bổ sung rất đáng hoan nghênh!

Nhìn chung - so với ARIMA, các mô hình không gian trạng thái cho phép bạn mô hình hóa các quy trình phức tạp hơn, có cấu trúc dễ hiểu và dễ dàng xử lý các bất thường dữ liệu; nhưng đối với điều này, bạn phải trả với sự phức tạp của một mô hình, hiệu chuẩn khó hơn, kiến thức cộng đồng ít hơn.

ARIMA là một công cụ xấp xỉ phổ quát - bạn không quan tâm đâu là mô hình thực sự đằng sau dữ liệu của bạn và bạn sử dụng các công cụ chẩn đoán và điều chỉnh ARIMA phổ quát để ước tính mô hình này. Nó giống như một đường cong đa thức phù hợp - bạn không quan tâm chức năng thực sự là gì, bạn luôn có thể ước chừng nó với một đa thức ở một mức độ nào đó.
Các mô hình không gian trạng thái tự nhiên yêu cầu bạn viết ra một số mô hình hợp lý cho quy trình của bạn (điều này tốt - bạn sử dụng kiến thức trước về quy trình của mình để cải thiện các ước tính). Tất nhiên, nếu bạn không có bất kỳ ý tưởng nào về quy trình của mình, bạn luôn có thể sử dụng một số mô hình không gian trạng thái phổ quát - ví dụ: đại diện cho ARIMA ở dạng không gian trạng thái. Nhưng sau đó ARIMA ở dạng ban đầu có công thức tuyệt vời hơn - mà không đưa ra các trạng thái ẩn không cần thiết.
Do có rất nhiều công thức mô hình không gian nhà nước (phong phú hơn nhiều so với lớp mô hình ARIMA), nên hành vi của tất cả các mô hình tiềm năng này không được nghiên cứu kỹ và nếu mô hình bạn xây dựng là phức tạp - thật khó để nói nó sẽ hoạt động như thế nào trong những hoàn cảnh khác nhau. Tất nhiên, nếu mô hình không gian trạng thái của bạn đơn giản hoặc bao gồm các thành phần có thể hiểu được, thì không có vấn đề như vậy. Nhưng ARIMA luôn luôn là ARIMA được nghiên cứu kỹ lưỡng nên việc dự đoán hành vi của nó sẽ dễ dàng hơn ngay cả khi bạn sử dụng nó để ước chừng một quá trình phức tạp.
Bởi vì không gian trạng thái cho phép bạn mô hình trực tiếp và chính xác mô hình phức tạp / phi tuyến, nên đối với các mô hình phức tạp / phi tuyến này, bạn có thể gặp vấn đề với tính ổn định của lọc / dự đoán (phân kỳ EKF / UKF, suy giảm bộ lọc hạt). Bạn cũng có thể gặp vấn đề với việc hiệu chỉnh các tham số của mô hình phức tạp - đó là vấn đề tối ưu hóa tính toán khó. ARIMA đơn giản, có ít tham số (1 nguồn nhiễu thay vì 2 nguồn nhiễu, không có biến ẩn) nên việc hiệu chỉnh của nó đơn giản hơn.
Đối với không gian nhà nước, có ít kiến thức và phần mềm cộng đồng trong cộng đồng thống kê hơn so với ARIMA.

— Ketede
nguồn

1

Bạn có biết về bất kỳ ứng dụng công nghiệp / ví dụ thực tế nào trong đó bộ lọc Kalman hoạt động tốt hơn mức trung bình di chuyển đơn giản hoặc làm mịn exp trong dự báo chuỗi thời gian với điều kiện không có mô hình cơ bản rõ ràng (vì vậy loại trừ các mô hình phát sinh từ các định luật vật lý) ? Trong hầu hết các bài báo, hiệu suất trông rất giống nhau (và các bài báo học thuật có xu hướng hiệu suất tích cực cho các mô hình mới, nguyên bản, phức tạp). Trong hầu hết các trường hợp, không có kiến thức về mô hình hệ thống trạng thái tuyến tính và hiệp phương sai phù hợp, v.v., được yêu cầu chỉ định bộ lọc Klaman ...

— Mannaggia

Đây là sự thật. Tôi vẫn có một ví dụ trong thực tế của tôi. Khi bạn có một số mô hình mục đích chung (như hồi quy tuyến tính) thì bạn có thể tạo các trạng thái tham số của Bộ lọc Kalman và ước tính chúng một cách linh hoạt. Tất nhiên, bạn cũng có thể chỉ chỉnh lại mô hình của mình ở mỗi bước, nhưng điều này tốn kém hơn nhiều về mặt tính toán so với một bản cập nhật KF duy nhất. Nếu trong thực tế các tham số thực sự thay đổi theo thời gian hoặc nếu mô hình của bạn không khớp chính xác với quy trình thực - điều này có thể giúp điều chỉnh mô hình của bạn tốt hơn và cải thiện hiệu suất của nó.

— Kochede

1

Tôi không thể tìm thấy bất kỳ tài liệu tham khảo nào cho ARIMA là một công cụ xấp xỉ phổ quát ngoài bài đăng của bạn. Bạn có thể chỉ cho tôi một?

— Skander H.

2

@Alex Điều này xuất phát từ định lý phân rã của Wold, ví dụ xem tại đây phdeconomics.sssup.it/document/Lesson11.pdf

— Kochede

1

Tôi có thể nói mô hình không gian trạng thái có dạng tổng quát hơn và ARIMA chỉ bao gồm một tập hợp con của nó không?

— Vickyyy

3

Cảm ơn @IrishStat vì một số câu hỏi rất hay trong phần bình luận, câu trả lời cho câu hỏi của bạn quá dài để đăng dưới dạng bình luận, vì vậy tôi đăng nó dưới dạng câu trả lời (thật không may, không phải là câu hỏi gốc của chủ đề).

Các câu hỏi là: " Nó có xác định rõ ràng sự thay đổi xu hướng thời gian và báo cáo các điểm tại thời điểm xu hướng thay đổi không? Nó có phân biệt giữa thay đổi tham số và thay đổi phương sai lỗi và báo cáo về điều này không? Người dự đoán có thể chỉ định số lượng giá trị tối thiểu trong một nhóm trước khi xu hướng thay đổi mức / thời gian cục bộ được khai báo không? Nó có phân biệt giữa nhu cầu biến đổi công suất so với các điểm xác định trong thời gian mà phương sai lỗi thay đổi không? "

Xác định thay đổi xu hướng - vâng, một cách tự nhiên nhất, bạn có thể biến độ dốc xu hướng thành một trong các biến trạng thái và KF sẽ liên tục ước tính độ dốc hiện tại. Sau đó, bạn có thể quyết định thay đổi độ dốc nào đủ lớn cho bạn. Ngoài ra, nếu độ dốc không thay đổi theo thời gian trong mô hình không gian trạng thái của bạn, bạn có thể kiểm tra phần dư trong quá trình lọc theo cách tiêu chuẩn để xem khi nào có sự phá vỡ mô hình của bạn.
Phân biệt giữa thay đổi tham số và thay đổi phương sai lỗi - có, phương sai có thể là một trong các tham số (trạng thái), sau đó tham số nào có khả năng thay đổi nhất phụ thuộc vào khả năng mô hình của bạn và cách dữ liệu đặc biệt đã thay đổi.
Phát hiện mối quan hệ chì / lag - không chắc chắn về điều này, bạn chắc chắn có thể đưa bất kỳ bình bị trễ nào vào mô hình không gian nhà nước; để lựa chọn độ trễ, bạn có thể kiểm tra phần dư của các mô hình có độ trễ khác nhau được bao gồm hoặc, trong trường hợp đơn giản, chỉ cần sử dụng biểu đồ tương quan chéo trước khi tạo mô hình.
Chỉ định số lượng ngưỡng quan sát để quyết định thay đổi xu hướng - có, như trong 1) vì quá trình lọc được thực hiện theo cách đệ quy, bạn không chỉ có thể thay đổi độ dốc đủ lớn cho bạn mà còn cả sự quan sát về độ tin cậy. Nhưng tốt hơn - KF tạo ra không chỉ ước tính độ dốc, mà cả các dải tin cậy cho ước tính này, vì vậy bạn có thể quyết định độ dốc thay đổi đáng kể khi độ tin cậy của nó vượt qua một số ngưỡng.
Phân biệt giữa nhu cầu chuyển đổi năng lượng và nhu cầu về phương sai lớn hơn - không chắc tôi hiểu đúng, nhưng tôi nghĩ bạn có thể kiểm tra phần dư trong quá trình lọc để xem liệu chúng có còn bình thường chỉ với phương sai lớn hơn hay chúng có một số sai lệch để bạn cần thay đổi mô hình của bạn. Tốt hơn - bạn có thể biến nó thành trạng thái chuyển đổi nhị phân của mô hình của mình, sau đó KF sẽ ước tính nó tự động dựa trên khả năng. Trong trường hợp này mô hình sẽ không tuyến tính, do đó bạn sẽ cần UKF để lọc.

— Ketede
nguồn

1

Bộ lọc Kalman là công cụ ước lượng bậc hai tuyến tính tối ưu khi các động thái trạng thái và sai số đo theo các giả định Gaussian tuyến tính ( http://wp.me/p491t5-PS ). Vì vậy, miễn là bạn biết động lực học và mô hình đo lường của mình và chúng tuân theo các giả định Gaussian tuyến tính, không có công cụ ước tính nào tốt hơn trong lớp các công cụ ước lượng bậc hai tuyến tính. Tuy nhiên, lý do phổ biến nhất cho các ứng dụng Bộ lọc Kalman "thất bại" là:

Hiểu biết / không chính xác về các mô hình đo lường và động lực học nhà nước.
Khởi tạo bộ lọc không chính xác (cung cấp ước tính trạng thái ban đầu và hiệp phương sai không phù hợp với trạng thái hệ thống thực). Điều này có thể dễ dàng khắc phục bằng cách sử dụng thủ tục khởi tạo Trọng số tối thiểu (WLS).
Kết hợp các phép đo là "ngoại lệ" thống kê đối với mô hình động lực học hệ thống. Điều này có thể khiến Kalman Gain có các yếu tố tiêu cực, có thể dẫn đến ma trận hiệp phương sai bán xác định không tích cực sau khi cập nhật. Điều này có thể tránh được bằng cách sử dụng các thuật toán "gating", chẳng hạn như gating elip, để xác thực phép đo trước khi cập nhật Bộ lọc Kalman với phép đo đó.

Đây là một số lỗi / sự cố phổ biến nhất tôi từng thấy khi làm việc với Bộ lọc Kalman. Mặt khác, nếu các giả định của các mô hình của bạn là hợp lệ, Bộ lọc Kalman là một công cụ ước tính tối ưu.

— concipiotech
nguồn

1

Bạn có thể tham khảo cuốn sách tuyệt vời Bayesian dự báo và mô hình năng động (Harrison and West, 1997). Các tác giả cho thấy hầu hết tất cả các mô hình chuỗi thời gian truyền thống là trường hợp cụ thể của mô hình động nói chung. Họ cũng nhấn mạnh những lợi thế. Có lẽ một trong những lợi thế chính là sự dễ dàng mà bạn có thể tích hợp nhiều mô hình không gian trạng thái bằng cách đơn giản là tăng vectơ trạng thái. Ví dụ, bạn có thể tích hợp liền mạch các biến hồi quy, các yếu tố theo mùa và một thành phần tự phát trong một mô hình duy nhất.

— Anselmo
nguồn

Xin chào, bạn có thể giải thích chi tiết hơn về "Ví dụ, bạn có thể tích hợp liền mạch các biến hồi quy, các yếu tố theo mùa và một thành phần tự phát trong một mô hình không."? Sửa lỗi cho tôi nếu tôi sai, điều đó có nghĩa là đối với ARIMA, bạn cần tạo chuỗi thời gian đứng yên nhưng đối với mô hình không gian trạng thái, bạn chỉ cần điều chỉnh số lượng biến trạng thái?

— Vickyyy

@Vickyyy Không giống như ARIMA, các mô hình không gian trạng thái không giả định sự đứng yên. Bạn chỉ có thể thêm nhiều thành phần vào nó và biểu diễn chúng trong một vectơ trạng thái duy nhất.

— Anselmo

1

Tôi muốn nói thêm rằng nếu bạn trực tiếp sử dụng chức năng Không gian trạng thái, có lẽ bạn sẽ phải hiểu một số ma trận tạo nên một mô hình và cách chúng tương tác và hoạt động. Nó giống như định nghĩa một chương trình hơn là xác định mô hình ARIMA. Nếu bạn đang làm việc với mô hình Không gian trạng thái động, nó thậm chí còn phức tạp hơn.

Nếu bạn sử dụng gói phần mềm có chức năng State Space thực sự rất đẹp, bạn có thể tránh được một số điều này, nhưng phần lớn các chức năng như vậy trong các gói R yêu cầu bạn phải nhảy vào chi tiết tại một số điểm.

Theo tôi, nó rất giống với thống kê của Bayes nói chung, bộ máy trong đó cần nhiều sự hiểu biết, chăm sóc và cho ăn hơn để sử dụng hơn các chức năng thường xuyên hơn.

Trong cả hai trường hợp, nó cũng xứng đáng với các chi tiết / kiến thức bổ sung, nhưng nó có thể là một rào cản đối với việc áp dụng.

— Wayne
nguồn