Làm mịn Laplace và Dirichlet trước


11

Trên bài viết trên wikipedia về làm mịn Laplace (hoặc làm mịn phụ gia), người ta nói rằng theo quan điểm của Bayes,

giá trị này tương ứng với giá trị dự kiến ​​của phân phối sau, sử dụng phân phối Dirichlet đối xứng với tham số như trước.α

Tôi hoang mang về cách điều đó thực sự đúng. Ai đó có thể giúp tôi hiểu làm thế nào hai điều đó là tương đương?

Cảm ơn!

Câu trả lời:


10

Chắc chắn rồi. Đây thực chất là quan sát rằng phân phối Dirichlet là một liên hợp trước cho phân phối đa thức. Điều này có nghĩa là chúng có dạng chức năng tương tự. Bài báo đề cập đến nó, nhưng tôi sẽ chỉ nhấn mạnh rằng điều này xuất phát từ mô hình lấy mẫu đa phương thức. Vì vậy, nhận được nó ...

Các quan sát là về sau, vì vậy hãy giới thiệu một số dữ liệu, , đó là tội danh mục riêng biệt. Chúng tôi quan sát tổng số mẫu . Chúng tôi sẽ giả sử được rút ra từ một bản phân phối không xác định (trên đó chúng tôi sẽ đặt trước trên -simplex).K N = K i = 1 x i x π D i r ( α ) KxKN=i=1KxixπDir(α)K

Xác suất sau của cho và dữ liệu làalpha xπαx

p(π|x,α)=p(x|π)p(π|α)

Khả năng, , là phân phối đa thức. Bây giờ hãy viết ra pdf:p(x|π)

p(x|π)=N!x1!xk!π1x1πkxk

p(π|α)= =1B(α)ΠTôi= =1KπTôiα-1

trong đó . Nhân lên, chúng tôi thấy rằng,B(α)= =Γ(α)KΓ(Kα)

p(π|α,x)= =p(x|π)p(π|α)αΠTôi= =1KπTôixTôi+α-1.

Nói cách khác, hậu thế cũng là Dirichlet. Câu hỏi là về ý nghĩa sau. Vì hậu thế là Dirichlet, chúng ta có thể áp dụng công thức cho giá trị trung bình của Dirichlet để tìm ra rằng,

E[πTôi|α,x]= =xTôi+αN+Kα.

Hi vọng điêu nay co ich!


p ( pi | alpha , x ) = p ( x | pi ) p ( pi | alpha ) ? πp(π|α,x)= =p(x|π)p(π|α)/p(x|α), vì vậy không sai khi nói rằngChúng tỷ lệ thuận với , nhưng tôi nghĩ việc viết một đẳng thức là không đúng. p(π|α,x)= =p(x|π)p(π|α)?π
michal

Tôi đã bối rối về điều này trong một thời gian dài, và tôi muốn chia sẻ nhận thức của mình. Những người này thúc đẩy làm mịn Laplace bởi Dirichlet đang sử dụng Ý nghĩa Posterior, chứ không phải MAP. Để đơn giản, giả sử phân phối Beta (trường hợp đơn giản nhất của Dirichlet) Giá trị trung bình sau là trong khi MAP làα+n s u c c e s s -1α+nSbạncceSSα+β+nSbạncceSS+nfmộtTôitôibạnreS . Vì vậy, nếu ai đó nóiα=β=1tương ứng với thêm 1 tới tử số và mẫu số 2 đến, đó là vì họ đang sử dụng Posterior Mean. α+nSbạncceSS-1α+β+nSbạncceSS+nfmộtTôitôibạnreS-2α= =β= =1
RMurphy

0

Là một lưu ý phụ, tôi cũng muốn thêm một điểm nữa vào đạo hàm trên, điều này không thực sự liên quan đến câu hỏi chính. Tuy nhiên, nói về các linh mục Dirichlet về phân phối đa quốc gia, tôi nghĩ rằng đáng để đề cập rằng hình thức của hàm khả năng là gì nếu chúng ta sẽ lấy xác suất làm biến số phiền toái.

p(π|α,x)ΠTôi= =1KπTôixTôi+α-1p(x|α)

p(x|α)= =ΠTôi= =1Kp(x|πTôi,α)p(π|α)dπ1dπ2...dπK

p(x|α)= =Γ(Kα)Γ(N+Kα)ΠTôi= =1KΓ(xTôi+α)Γ(α)

N

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.