Trước tiên, bạn nên tìm hiểu về các mô hình không gian trạng thái dễ mã hóa và lọc dạng đóng (ví dụ: bộ lọc kalman, mô hình markov ẩn). Matthew Gunn đúng là bạn có thể đi xa một cách đáng ngạc nhiên với các khái niệm đơn giản, nhưng theo ý kiến khiêm tốn của tôi, bạn nên biến điều này thành mục tiêu trung gian vì:
1.) Nói một cách tương đối, có nhiều phần chuyển động hơn trong các mô hình không gian trạng thái. Khi bạn học SSM hoặc các mô hình markov ẩn, có rất nhiều ký hiệu. Điều này có nghĩa là có nhiều thứ hơn để giữ trong bộ nhớ làm việc của bạn trong khi bạn chơi xung quanh với việc xác minh mọi thứ. Cá nhân, khi tôi tìm hiểu về các bộ lọc Kalman và SSM Gaussian tuyến tính trước tiên, tôi đã suy nghĩ về cơ bản "eh đây chỉ là thuộc tính của các vectơ thông thường đa biến ... Tôi chỉ cần theo dõi ma trận nào là ma trận." Ngoài ra, nếu bạn chuyển đổi giữa các cuốn sách, chúng thường thay đổi ký hiệu.
Sau đó tôi nghĩ về nó như "eh, đây chỉ là quy tắc của Bayes ở mọi thời điểm." Khi bạn nghĩ về nó theo cách này, bạn sẽ hiểu tại sao các gia đình liên hợp lại tốt đẹp, như trong trường hợp của bộ lọc Kalman. Khi bạn mã hóa một mô hình markov ẩn, với không gian trạng thái riêng biệt của nó, bạn sẽ thấy lý do tại sao bạn không phải tính toán bất kỳ khả năng nào và việc lọc / làm mịn rất dễ dàng. (Tôi nghĩ rằng tôi đang đi chệch khỏi biệt ngữ hmm hội nghị ở đây.)
2.) Cắt răng khi mã hóa rất nhiều trong số này sẽ khiến bạn nhận ra định nghĩa chung của mô hình không gian trạng thái là như thế nào. Sẽ sớm thôi bạn sẽ viết ra những mô hình bạn muốn sử dụng, đồng thời xem lý do tại sao bạn không thể. Trước tiên, bạn sẽ thấy rằng bạn không thể viết nó ra dưới một trong hai hình thức mà bạn đã quen. Khi bạn nghĩ về nó nhiều hơn một chút, bạn viết ra quy tắc của Bayes và thấy vấn đề là bạn không có khả năng tính toán một số khả năng cho dữ liệu.
Vì vậy, cuối cùng bạn sẽ thất bại trong việc tính toán các phân phối sau này (làm mịn hoặc lọc các phân phối của các trạng thái). Để giải quyết vấn đề này, có rất nhiều công cụ lọc gần đúng ngoài kia. Lọc hạt chỉ là một trong số họ. Điểm chính của lọc hạt: bạn mô phỏng từ các phân phối này vì bạn không thể tính toán chúng.
Làm thế nào để bạn mô phỏng? Hầu hết các thuật toán chỉ là một số biến thể của lấy mẫu quan trọng. Nhưng nó cũng trở nên phức tạp hơn ở đây. Tôi khuyên bạn nên viết bài hướng dẫn của Doucet và Johansen ( http://www.cs.ubc.ca/~arnaud/doucet_johansen_tutorialPF.pdf ). Nếu bạn hiểu cách lọc biểu mẫu kín hoạt động, họ đưa ra ý tưởng chung về lấy mẫu quan trọng, sau đó là ý tưởng chung về phương pháp monte carlo, và sau đó chỉ cho bạn cách sử dụng hai điều này để bắt đầu với một ví dụ về chuỗi thời gian tài chính tốt đẹp. IMHO, đây là hướng dẫn tốt nhất về lọc hạt mà tôi đã đi qua.
Ngoài việc thêm hai ý tưởng mới vào hỗn hợp (lấy mẫu quan trọng và phương pháp monte carlo), giờ đây còn có nhiều ký hiệu hơn. Một số mật độ bạn đang lấy mẫu từ bây giờ; một số bạn đang đánh giá và khi bạn đánh giá chúng, bạn đang đánh giá tại các mẫu. Kết quả, sau khi bạn mã hóa tất cả, là các mẫu có trọng số, các hạt được coi là. Họ thay đổi sau mỗi lần quan sát mới. Sẽ rất khó để chọn tất cả những thứ này cùng một lúc. Tôi nghĩ đó là một quá trình.
Tôi xin lỗi nếu tôi đi qua như mật mã, hoặc tay. Đây chỉ là dòng thời gian cho sự quen thuộc cá nhân của tôi với chủ đề này. Bài viết của Matthew Gunn có thể trả lời trực tiếp hơn câu hỏi của bạn. Tôi chỉ cần tìm ra rằng tôi sẽ đưa ra phản ứng này.