Có phải cộng đồng học máy đang lạm dụng điều kiện trên điều lệ và trên nền tảng của param


13

Nói, phụ thuộc vào α . Nói một cách nghiêm túc,Xα

  • nếu α đều là hai biến ngẫu nhiên, chúng ta có thể viết p ( X α ) ;Xαp(X|α)

  • tuy nhiên, nếu là biến ngẫu nhiên và α là tham số, chúng ta phải viết p ( X ; α ) .Xαp(X;α)

Tôi nhận thấy nhiều lần rằng cộng đồng học máy dường như bỏ qua sự khác biệt và lạm dụng các điều khoản.

Ví dụ, trong mô hình LDA nổi tiếng, trong đó là tham số Dirichlet thay vì một biến ngẫu nhiên.α

nhập mô tả hình ảnh ở đây

Không nên nó được ? Tôi thấy rất nhiều người, kể cả tác giả gốc giấy LDA của, hãy viết nó như p ( q | alpha ) .p(θ;α)p(θα)


6
Về mặt toán học, bạn luôn có thể điều kiện trên một hằng số, vì đây là trường hợp giới hạn của biến ngẫu nhiên. Từ quan điểm của Bayes, tất cả các ẩn số được coi là các biến ngẫu nhiên, vì vậy sẽ rất hợp lý khi sử dụng ký hiệu điều hòa khắp nơi.
Tây An

1
@ Xi'an Tôi hiểu quan điểm của bạn về "điều hòa không đổi". Nhưng hãy tưởng tượng tôi vẽ từ một phân phối phân loại của tham số θ , tức là X ~ C một t ( θ ) . Tôi có thể viết sự phân bố như p ( X | q ) ? Đó là vẻ lạ với tôi, vì người ta có thể thiết lập một cố định θ . p ( X ; θ ) có vẻ thoải mái hơn với tôi. XθX~Cmộtt(θ)p(X|θ)θp(X;θ)
Đánh bạc Sibbs

4
Tôi không thấy vấn đề khi viết trong trường hợp đặc biệt này. Một lần nữa, việc sử dụng các ký hiệu có điều kiện mở đường cho việc giới thiệu các bản phân phối trước trên mỗi tham số chưa biết. p(X|θ)
Tây An

Câu trả lời:


14

Tôi nghĩ rằng đây là nhiều hơn về thống kê Bayes / không Bayes so với thống kê máy học so với .. thống kê.

X,αp(X|α)Xαααp(X;α)p(X|α)p(α)ααα

p(X;α)p(X|α)p|

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.