Phát hiện thay đổi trực tuyến Bayes (phân phối dự báo cận biên)


9

Tôi đang đọc bài phát hiện thay đổi trực tuyến Bayes của Adams và MacKay ( liên kết ).

Các tác giả bắt đầu bằng cách viết phân phối dự báo cận biên: trong đó

P(xt+1|x1:t)=rtP(xt+1|rt,xt(r))P(rt|x1:t)(1)
  • xt là quan sát tại thời điểm ;t
  • x1:t biểu thị tập hợp quan sát cho đến thời điểm ;t
  • rtN là runlength hiện tại (thời gian kể từ lần thay đổi cuối cùng, có thể là 0); và
  • xt(r) là tập hợp các quan sát liên quan đến run .rt

Phương trình 1 là chính xác (xem phần trả lời bên dưới của @JuhoKokkala), nhưng tôi hiểu là nếu bạn thực sự muốn đưa ra dự đoán về bạn cần mở rộng nó như sau:xt+1

P(xt+1|x1:t)=rt,rt+1P(xt+1|rt+1,xt(r))P(rt|x1:t)P(rt+1|rt)(1b)

Lý do của tôi là có thể có một thay đổi tại thời điểm (tương lai) , nhưng sau chỉ bao gồm cho đến .P ( r t | x 1 : t ) tt+1P(rt|x1:t)t

Vấn đề là, các tác giả trong bài báo làm cho chúng ta về phương trình. 1 như hiện tại (xem Phương trình 3 và 11 trong bài viết), chứ không phải 1b. Vì vậy, họ dường như bỏ qua khả năng thay đổi tại thời điểm khi dự đoán từ dữ liệu có sẵn tại thời điểm . Ở đầu Phần 2, họ nói en passantx t + 1 tt+1xt+1t

Chúng tôi giả định rằng chúng tôi có thể tính toán phân phối dự đoán [cho ] có điều kiện trên một chiều dài chạy nhất định . r txt+1rt

mà có lẽ đó là nơi mà mánh khóe Nhưng nói chung, phân phối dự đoán này sẽ trông giống như biểu thức. 1b; đó không phải là những gì họ làm (phương trình 11).

Vì vậy, tôi không chắc tôi hiểu những gì đang xảy ra. Có lẽ có một cái gì đó buồn cười xảy ra với ký hiệu.


Tài liệu tham khảo

  • Adams, RP, & MacKay, DJ (2007). Bayesian phát hiện thay đổi trực tuyến. bản in sẵn arXiv arXiv: 0710.3742.

Một lời giải thích tiềm năng là đại diện cho thời lượng chạy ở cuối bước thời gian t , tức là sau khi thay đổi tại thời điểm t . Với điều này, phương trình. 1 có ý nghĩa. Trong thực tế, một khởi tạo của thuật toán là bằng cách đặt P ( r 0 = 0 ) = 1 , giả sử rằng có một điểm thay đổi ngay trước khi bắt đầu tại t = 1 . Tuy nhiên, Hình 1 sai (hoặc ít nhất là sai lệch) ở chỗ nếu có sự thay đổi giữa t = 4t = 5 và giữartttP(r0=0)=1t=1t=4t=5 t = 11 như mô tả trong Hình 1a, sau đóvàphải là 0 theo ký hiệu này, chứ không phảivànhư Hình 1b. t=10t=11r 10 r 5 r 11r4r10r5r11
lacerbi

1
Có một cái gì đó kỳ lạ đang diễn ra trong phương trình. 3 là yếu tố trung bình trong summand ở dòng cuối cùng là trong khi tôi nghĩ chứa . Tôi nghi ngờ và đã chuyển vị trí là sẽ có ý nghĩa. Trong phương trình. 11, phía bên tay phải dường như phụ thuộc vào hoàn toàn không xuất hiện ở phía bên tay trái, vì vậy có gì đó không đúng hoặc tôi hoàn toàn không hiểu ký hiệu. x ( r ) t x t t t - 1 P ( x tr t , x ( r ) t - 1 ) x ( r ) tP(xt|rt-1,xt(r))xt(r)xttt-1P(xt|rt,xt-1(r))xt(r)
Juho Kokkala

@JuhoKokkala: Tôi rất vui vì tôi không phải là người duy nhất có cảm giác đó ...
lacerbi

1
@lacerbi, tôi có một câu hỏi khác về bài viết này và nghĩ rằng bạn có thể trả lời nó vì bạn có vẻ quen thuộc với công việc: stats.stackexchange.com/questions/419988 .
gwg

Câu trả lời:


5

Cả (1) và (1b) đều đúng. OP có quyền rằng (trong mô hình này) có thể có một điểm thay đổi tại và tùy thuộc vào việc có thay đổi hay không. Điều này không ngụ ý bất kỳ vấn đề nào với (1) vì các giá trị có thể có của được "bao phủ" hoàn toàn bởi . có nghĩa là phân phối có điều kiện của điều kiện trên . Phân phối có điều kiện này tính trung bình trên "mọi thứ khác", bao gồm , có điều kiện trên . Giống như người ta có thể viết, giả sử,x t + 1 r t + 1t+1xt+1rt+1P ( x t + 1 | r t , x 1 : t ) x t + 1 ( r t , x 1 : t ) r t + 1 , x 1P(xt+1|rt,x1:t)P(xt+1|rt,x1:t)xt+1(rt,x1:t)rt+1P( x t + 1000 | x t )(rt,x1:t)P(xt+1000|xt), sẽ tính đến tất cả các cấu hình có thể thay đổi cũng như các giá trị của s xảy ra giữa và . t t + 1000xitt+1000

Trong phần còn lại, đầu tiên tôi lấy (1) và sau đó (1b) dựa trên (1).

Đạo hàm của (1)

Đối với bất kỳ biến ngẫu nhiên , chúng ta có miễn là rời rạc (nếu không thì tổng cần phải được thay thế bằng tích phân). Áp dụng điều này cho :P ( A B ) = c P ( A B , C = c )A,B,CC x t + 1 , x 1 : t , r t

P(Một|B)= =ΣcP(Một|B,C= =c)P(C= =c|B),
Cxt+1,x1:t,rt

P(xt+1|x1:t)= =ΣrtP(xt+1|rt,x1:t)P(rt|x1:t),
không có vấn đề gì phụ thuộc giữa , , , nghĩa là chưa có giả định mô hình nào đã được sử dụng. Trong mô hình hiện tại, cho được giả sử * là độc lập có điều kiện với các giá trị của từ các lần chạy trước . Điều này hàm ý . Thay thế điều này vào phương trình trước, chúng ta nhận đượcx 1 : t x t + 1 x t + 1 r t , x ( r ) t x x ( r ) t P ( x t + 1r t , x 1 : t ) = P ( x trtx1:txt+1xt+1rt,xt(r)xxt(r)P(xt+1rt,x1:t)= =P(xt+1|rt,xt(r))

P(xt+1|x1:t)= =ΣrtP(xt+1|rt,xt(r))P(rt|x1:t),(1)
là (1) trong OP.

Đạo hàm của (1b)

Chúng ta hãy xem xét sự phân rã của trên các giá trị có thể có của : r t + 1 P ( x t + 1 | r t , x ( r ) t ) = Σ r t + 1 P ( x t + 1 | r t + 1 , r t , x ( r )P(xt+1|rt,xt(r))rt+1

P(xt+1|rt,xt(r))= =Σrt+1P(xt+1|rt+1,rt,xt(r))P(rt+1|rt,xt(r)).

Vì người ta cho rằng * việc thay đổi xảy ra ở (giữa và ) không phụ thuộc vào lịch sử của , nên chúng ta có . Hơn nữa, vì xác định xem thuộc cùng một hoạt động như , chúng ta có . Thay thế hai đơn giản hóa này vào hệ số hóa ở trên, chúng ta sẽ nhận được t+1xtxt+1xP(rt+1|rt,xt(r))= =P(rt+1|rt)rt+1xt+1xtP(xt+1|rt+1,rt,xt(r))= =P(xt+1|rt+1,xt(r))

P(xt+1|rt,xt(r))= =Σrt+1P(xt+1|rt+1,xt(r))P(rt+1|rt).
Thay thế điều này vào (1), chúng ta sẽ có là OP's (1b).
P(xt+1|x1:t)= =Σrt(Σrt+1P(xt+1|rt+1,xt(r))P(rt+1|rt))P(rt|x1:t),(1b)

* Nhận xét về các giả định độc lập có điều kiện của mô hình

Dựa trên việc duyệt nhanh bài báo, cá nhân tôi muốn các thuộc tính độc lập có điều kiện được nêu rõ hơn ở đâu đó, nhưng tôi cho rằng ý định là là Markovian và các : s liên quan đến các lần chạy khác nhau là độc lập (với các lần chạy).rx


1
(+1) Cảm ơn. Yep, tất nhiên, tôi hiểu rằng phương trình. 1 là chính thức chính xác nếu một giả định cận biên ngầm định trên . Vấn đề là sau này các tác giả đưa ra dự đoán (Phương trình 11 trong bài báo, và ngầm định trong Phương trình 3) và họ dường như không bị thiệt thòi so với khi họ đưa chúng. rt+1rt+1
lacerbi

1
Oh. Có vẻ như sau đó tôi đã hiểu nhầm câu hỏi - tôi có nên xóa cái này không? Bạn có thể muốn làm rõ câu hỏi, hiện tại có vẻ như (1) bằng cách nào đó không chính xác (thay vì có lẽ không hữu ích)
Juho Kokkala

Hãy giữ câu trả lời này, có giá trị. Lỗi của tôi là tôi đã không đủ rõ ràng trong bài viết gốc của mình. Tôi đã cố gắng làm rõ câu hỏi của mình nhờ ý kiến ​​của bạn, và theo cách mà vẫn làm cho câu trả lời này có ý nghĩa.
lacerbi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.