Tôi sẽ bắt đầu lại từ đầu, vì bài đăng gốc có một số lỗi chính tả như sai, bỏ ma trận , v.v.V
Bạn đã chỉ định và khả năng: .p ( y | β ) = N ( B β , σ 2 I )p(β)=N(0,σ2V)p(y|β)=N(Bβ,σ2I)
Chúng ta có thể viết mỗi thứ này hoàn toàn dưới dạng biểu thức của các thuật ngữ bên trong phụ thuộc vào , nhóm tất cả các thuật ngữ không liên quan đến vào một hằng số duy nhất:beta betaexpββ
logp(β)+const=−12σ2βTV−1β
logp(y|β)+const=−12σ2(βTBTBβ−2yTBβ) (lưu ý rằng luôn)yTBβ=βTBTy
Đã thêm chúng vào không gian nhật ký và thu thập như các thuật ngữ mang lại hậu quả nhật ký không chuẩn hóa
logp(β|y)+const=−12σ2(βT(V−1+BTB)β−2yTBβ) (1)
... ở đây, chúng tôi đã sử dụng danh tính tiêu chuẩn cho bất kỳ vectơ và ma trận có kích thước phù hợp.xTAx+xTCx=xT(A+C)xxA,C
OK, mục tiêu của chúng tôi bây giờ là "hoàn thành" hình vuông. Chúng tôi muốn một biểu thức của biểu mẫu bên dưới, điều này sẽ chỉ ra rằng hậu thế cho là Gaussian.β
logp(β|y)+const=(β−μp)TΛp(β−μp)=βTΛpβ−2μTpΛpβ+μTpΛpμp
trong đó các tham số xác định ma trận hiệp phương sai trung bình và nghịch đảo tương ứng. μp,Λp
Vâng, bằng cách kiểm tra eqn. (1) trông rất giống mẫu này nếu chúng ta đặt
Λp=V−1+BTB và
μp=Λ−1pBTy
Cụ thể, chúng tôi có thể chỉ ra rằng sự thay thế này tạo ra mỗi thuật ngữ cần thiết từ (1):
Thuật ngữ bậc hai:βTΛpβ=βT(V−1+BTB)β
thuật ngữ tuyến tính:μTpΛpβ=(Λ−1pBTy)TΛpβ=yTBΛ−1pΛpβ=yTBβ
.... ở đây chúng tôi đã sử dụng các sự kiện và do tính đối xứng ( là đối xứng, vì vậy là nghịch đảo của nó).(AB)T=BTAT(Λ−1p)T=Λ−1pΛp
Tuy nhiên, điều này khiến chúng tôi có thêm một thuật ngữ khó chịu . Để tránh điều này, chúng tôi chỉ trừ thuật ngữ này khỏi kết quả cuối cùng của chúng tôi. Do đó, chúng ta có thể thay thế trực tiếp các tham số thành (1) để có đượcμTpΛpμpμp,Λp
logp(β|y)+const=−12σ2[(β−μp)TΛp(β−μp)−μpΛpμp]
vì thuật ngữ cuối cùng không đổi đối với , chúng tôi chỉ có thể đưa nó vào hằng số chuẩn hóa lớn ở phía bên trái và chúng tôi đã đạt được mục tiêu của mình.β