Bộ lọc Bootstrap / Thuật toán bộ lọc hạt (Hiểu)

Tôi thực sự thiếu hiểu biết về cách hoạt động của bộ lọc bootstrap. Tôi đại khái biết các khái niệm nhưng tôi không nắm bắt được một số chi tiết nhất định. Câu hỏi này là để tôi làm sáng tỏ sự lộn xộn. Ở đây tôi sẽ sử dụng thuật toán lọc phổ biến này từ một tài liệu tham khảo của doucet (cho đến nay tôi nghĩ đây là tài liệu tham khảo dễ nhất). Trước tiên tôi xin nói với bạn rằng vấn đề của tôi là hiểu được phân phối nào được biết và không biết.

Đây là những câu hỏi của tôi:

Trong 2), phân phối gì? Là phân phối này được biết đến ? Chúng ta có biết phân phối này cho tất cả ? Nếu vậy, nhưng nếu chúng ta không thể lấy mẫu từ nó thì sao? Thật buồn cười khi họ gọi bước lấy mẫu quan trọng này nhưng tôi thấy không có phân phối đề xuất nào. $p(x_t|x^{(i)}_{t-1})$ $t$
Ngoài ra trong 2) là một phân phối đã biết ? "Normalize Trọng lượng Tầm quan trọng phương tiện để $p(y_t|\tilde{x}^{(i)}_{t})$ ? Dấu ngã trênvàcó nghĩa là gì? Nó có nghĩa là một cái gì đó như không được chỉnh sửa lại hoặc không được chuẩn hóa tương ứng? $w^{(i)}_{t}=\frac{\tilde{w}^{(i)}_{t}}{\sum_{i=1}^{N}\tilde{w}^{(i)}_{t}}$ $x$ $w$
Tôi sẽ đánh giá cao nếu bất cứ ai cũng có thể đưa ra một ví dụ đồ chơi đơn giản bằng cách sử dụng các bản phân phối nổi tiếng để sử dụng bộ lọc bootstrap này. Mục tiêu cuối cùng của bộ lọc bootstrap đối với tôi không rõ ràng.

particle-filter

— tintinthong
nguồn

Đó là mật độ chuyển tiếp của trạng thái ( ), là một phần của mô hình của bạn và do đó được biết đến. Bạn cần phải lấy mẫu từ nó trong thuật toán cơ bản, nhưng gần đúng là có thể. là phân phối đề xuất trong trường hợp này. Nó được sử dụng vì phân phối thường không thể kéo được. $x_t$ $p(x_t|x_{t-1})$ $p(x_t|x_{0:t-1},y_{1:t})$
Vâng, đó là mật độ quan sát, cũng là một phần của mô hình, và do đó được biết đến. Vâng, đó là những gì bình thường hóa có nghĩa. Dấu ngã được sử dụng để biểu thị một cái gì đó như "sơ bộ": là trước khi lấy mẫu lại và là trước khi tái chuẩn hóa. Tôi đoán rằng nó được thực hiện theo cách này để ký hiệu khớp với các biến thể của thuật toán không có bước lấy mẫu lại (tức là luôn là ước tính cuối cùng). $\tilde{x}$ $x$ $\tilde{w}$ $w$ $x$
$p(x_t|y_{1:t})$ $t$ $t$

Hãy xem xét mô hình đơn giản:

X_{t} = X_{t - 1} + η_{t}, η_{t} \sim N (0, 1)

$X_t = X_{t-1} + \eta_t, \quad \eta_t \sim N(0,1)$

X_{0} \sim N (0, 1)

$X_0 \sim N(0,1)$

Y_{t} = X_{t} + ε_{t}, ε_{t} \sim N (0, 1)

$Y_t = X_t + \varepsilon_t, \quad \varepsilon_t \sim N(0,1)$

$Y$ $X$ $p(X_t|Y_1, ..., Y_t)$

X_{t} | X_{t - 1} \sim N (X_{t - 1}, 1)

$X_t | X_{t-1} \sim N(X_{t-1},1)$

X_{0} \sim N (0, 1)

$X_0 \sim N(0,1)$

Y_{t} | X_{t} \sim N (X_{t}, 1)

$Y_t | X_t \sim N(X_t,1)$

Áp dụng thuật toán:

$N$ $X_0^{(i)} \sim N(0,1)$
$X_1^{(i)} | X_0^{(i)} \sim N(X_0^{(i)},1)$ $N$

$\tilde{w}_t^{(i)} = \phi(y_t; x_t^{(i)},1)$ $\phi(x; \mu, \sigma^2)$ $\mu$ $\sigma^2$ $y_t$
$w_t$ $x$ $x_{0:t}^{(i)}$

Quay trở lại bước 2, tiến về phía trước với phiên bản được ghép lại của các hạt, cho đến khi chúng tôi xử lý toàn bộ chuỗi.

Một triển khai trong R như sau:

# Simulate some fake data
set.seed(123)

tau <- 100
x <- cumsum(rnorm(tau))
y <- x + rnorm(tau)

# Begin particle filter
N <- 1000
x.pf <- matrix(rep(NA,(tau+1)*N),nrow=tau+1)

# 1. Initialize
x.pf[1, ] <- rnorm(N)
m <- rep(NA,tau)
for (t in 2:(tau+1)) {
  # 2. Importance sampling step
  x.pf[t, ] <- x.pf[t-1,] + rnorm(N)

  #Likelihood
  w.tilde <- dnorm(y[t-1], mean=x.pf[t, ])

  #Normalize
  w <- w.tilde/sum(w.tilde)

  # NOTE: This step isn't part of your description of the algorithm, but I'm going to compute the mean
  # of the particle distribution here to compare with the Kalman filter later. Note that this is done BEFORE resampling
  m[t-1] <- sum(w*x.pf[t,])

  # 3. Resampling step
  s <- sample(1:N, size=N, replace=TRUE, prob=w)

  # Note: resample WHOLE path, not just x.pf[t, ]
  x.pf <- x.pf[, s]
}

plot(x)
lines(m,col="red")

# Let's do the Kalman filter to compare
library(dlm)
lines(dropFirst(dlmFilter(y, dlmModPoly(order=1))$m), col="blue")

legend("topleft", legend = c("Actual x", "Particle filter (mean)", "Kalman filter"), col=c("black","red","blue"), lwd=1)

Biểu đồ kết quả:

Một hướng dẫn hữu ích là một của Doucet và Johansen, xem tại đây .

— Chris Haug
nguồn

X_{1}^{(i)} | X_{0}^{(i)} \sim N (0, 1)

$X_1^{(i)} | X_0^{(i)} \sim N(0,1)$

X_{1}^{(i)} | X_{0}^{(i)} \sim N (X_{0}^{(i)}, 1)

$X_1^{(i)} | X_0^{(i)} \sim N(X_0^{(i)},1)$

— tintinthong

Điều đó đúng, tôi đã sửa lỗi đánh máy

— Chris Haug

Các đường dẫn không phải được lấy mẫu lại phải không ?? Từ các tài liệu khác, không cần phải lấy mẫu các đường dẫn. Tôi chỉ cần lấy mẫu các hạt ở mỗi bước thời gian. Tôi đã tự hỏi liệu có một lý do cho việc lấy lại các đường dẫn

— tintinthong