Mô hình Multinomial-Dirichlet với phân bố siêu nhân trên các tham số nồng độ


10

Tôi sẽ cố gắng mô tả vấn đề trong tay càng chung càng tốt. Tôi đang mô hình hóa các quan sát như là một phân phối phân loại với một vectơ xác suất tham số theta.

Sau đó, tôi giả sử vectơ tham số theta tuân theo phân phối trước Dirichlet với các tham số .α1,α2,,αk

Có phải sau đó cũng có thể áp đặt phân phối siêu nhân lên các tham số ? Nó sẽ phải là một phân phối đa biến như phân phối phân loại và dirichlet? Dường như với tôi các alpha luôn tích cực vì vậy một siêu nhân gamma nên hoạt động.α1,α2,,αk

Không chắc ai đã thử lắp các mô hình quá khổ như vậy (có thể) nhưng có vẻ hợp lý với tôi khi nghĩ rằng không nên sửa lỗi alpha mà đến từ phân phối gamma.

Hãy cố gắng cung cấp cho tôi một số tài liệu tham khảo, hiểu biết về cách tôi có thể thử cách tiếp cận như vậy trong thực tế.


Vâng, điều này là có thể và nó đã được thực hiện. Nói chung, điều này được gọi là mô hình phân cấp Bayes. Tốt hơn là, điều này trước nên tính đến các phụ thuộc có thể.

@Procrastinator cảm ơn. Bạn có một số tài liệu tham khảo cho các mô hình phân cấp Bayes tốt đối phó với loại mô hình này không? cảm ơn.
Dnaiel

@Procrastinator: Bạn đã có được bất kỳ giấy tờ / báo cáo hoặc tài liệu ứng dụng thực hành lý tưởng nào liên quan đến Mô hình phân cấp Bayes chưa?
Zhubarb

Câu trả lời:


12

Tôi không nghĩ rằng đây là một mô hình "quá mức". Tôi sẽ lập luận rằng bằng cách đặt ưu tiên cho các thông số Dirichlet, bạn sẽ ít cam kết hơn về bất kỳ kết quả cụ thể nào. Cụ thể, như bạn có thể biết, đối với các phân phối đối xứng (ví dụ ), cài đặt cung cấp nhiều xác suất trước cho các phân phối đa phương thưa thớt, trong khi cung cấp xác suất trước nhiều hơn cho phân phối đa cực mịn.α1=α2=...αKα<1α>1

Trong trường hợp người ta không có kỳ vọng mạnh mẽ đối với các phân phối đa phương thức thưa thớt hoặc dày đặc, việc đặt một siêu nhân trên phân phối Dirichlet của bạn sẽ giúp mô hình của bạn thêm linh hoạt để lựa chọn giữa chúng.

Ban đầu tôi có ý tưởng làm việc này từ bài báo này . Siêu nhân họ sử dụng hơi khác so với những gì bạn đề xuất. Họ lấy mẫu một vectơ xác suất từ ​​một dirichlet và sau đó nhân rộng nó bằng cách rút ra từ một hàm mũ (hoặc gamma). Vì vậy, mô hình là

βDirichlet(1)λExponential()θDirichlet(βλ)

Dirichlet thêm chỉ đơn giản là để tránh đối xứng áp đặt.

Tôi cũng đã thấy mọi người chỉ sử dụng siêu Gamma trước cho Dirichlet trong bối cảnh các mô hình markov ẩn với các phân phối phát xạ đa cực, nhưng dường như tôi không thể tìm thấy tài liệu tham khảo. Ngoài ra, có vẻ như tôi đã gặp các hypers tương tự được sử dụng trong các mô hình chủ đề.


Cảm ơn câu trả lời tuyệt vời! Tôi có một Q theo dõi ngắn, mô hình này có cho phép thay đổi khác nhau cho mỗi thetas không? Tôi có câu hỏi này vì tham số lambda được chia sẻ trên tất cả các thetas, do đó tất cả chúng đều có chung tham số tỷ lệ nên tôi đã tự hỏi trong trường hợp quá mức, mô hình sẽ cung cấp tính linh hoạt như vậy. Trực giác / kiến ​​thức của bạn ở đây được đánh giá rất cao! cảm ơn!
Dnaiel

@Dnaiel, hãy cho tôi biết nếu tôi hiểu nhầm câu hỏi của bạn, nhưng có ngay cả với dirichlet đối xứng trước đó, giả sử , rút ​​ra từ phân phối đó sẽ có xu hướng tạo ra các vectơ thưa thớt . Bởi thưa thớt, ý tôi là nếu bạn vẽ vectơ như một biểu đồ thì nó sẽ rất đỉnh, thay vì bằng phẳng. Trong mô hình ở trên, các tham số Dirichlet không đối xứng do tham số được rút ra từ một siêu nhân dirichlet. Dirichlet(0.2,0.2,0.2,0.2)θθβ
jerad

4

Để giải thích một giải pháp cho vấn đề siêu chiến binh này, tôi đã triển khai một mô hình gamma-Dirichlet-multinomial phân cấp trong PyMC3. Gamma trước cho Dirichlet được chỉ định và lấy mẫu theo bài đăng trên blog của Ted Dunning .

Mô hình tôi triển khai có thể được tìm thấy tại Gist này nhưng cũng được mô tả bên dưới:

Đây là mô hình phân cấp (gộp) của Bayes cho xếp hạng phim. Mỗi bộ phim có thể được đánh giá theo thang điểm từ 0 đến 5. Mỗi bộ phim được đánh giá nhiều lần. Chúng tôi muốn tìm một bản phân phối xếp hạng mượt mà cho mỗi bộ phim.

Chúng tôi sẽ tìm hiểu một phân phối trước cấp cao nhất (siêu nhân) về xếp hạng phim từ dữ liệu. Mỗi bộ phim sau đó sẽ có ưu tiên riêng được làm mịn bởi cấp cao nhất này trước. Một cách nghĩ khác về điều này là việc ưu tiên xếp hạng cho mỗi bộ phim sẽ bị thu hẹp về phía phân phối theo cấp độ nhóm hoặc gộp lại.

Nếu một bộ phim có phân phối xếp hạng không điển hình, phương pháp này sẽ thu hẹp xếp hạng thành thứ gì đó phù hợp hơn với những gì được mong đợi. Hơn nữa, điều này đã học trước có thể hữu ích đối với các phim bootstrap có ít xếp hạng để cho phép chúng được so sánh một cách có ý nghĩa với các phim có nhiều xếp hạng.

Mô hình như sau:

γk=1...KGamma(α,β)

θm=1...MDirichletM(cγ1,...,cγK)

zm=1...M,n=1...NmCategoricalM(θm)

Ở đâu:

  • K số mức xếp hạng phim (ví dụ: ngụ ý xếp hạng 0, ..., 5)K=6
  • M số phim được đánh giá
  • Nm số xếp hạng cho phimm
  • α=1/K để làm cho bộ sưu tập gamma rvs hoạt động như một hệ số mũ
  • β Tham số tỷ lệ cho cấp cao nhất theo cấp số nhân trước
  • c tham số nồng độ cho thấy sức mạnh của cấp cao nhất trước
  • γk cấp cao nhất trước cấp độ xếp hạngk
  • θm phim trước cho các mức xếp hạng (đa biến với thứ nguyên = )K
  • zmn rating cho phimnm

1

Đây là mô hình liên hợp Bayes trực tiếp trước. Một phần mở rộng tự nhiên từ mô hình Beta-Binomial. Một nguồn tốt cho việc này có thể là từ cuốn sách . Và Posterior cũng là Dirichlet và do đó mô phỏng từ dirichlet sẽ đưa ra những tóm tắt cần thiết


1
cảm ơn. Tôi quen thuộc với cuốn sách như vậy, tài liệu tham khảo tuyệt vời. Tôi đã cố gắng xem xét nó nhưng họ không cung cấp trực tiếp mô hình phân cấp đa cấp như vậy, nhưng họ có rất nhiều ý tưởng hay có thể áp dụng.
Dnaiel

1
Dirichlet-multinomial là một mô hình liên hợp, nhưng op đã hỏi về một (hyper-) trước các tham số của Dirichlet. Không có liên hợp tiêu chuẩn nào trước khi phân phối Dirichlet, mặc dù trên thực tế người ta phải tồn tại , vì nó là thành viên của gia đình hàm mũ.
jerad
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.