Việc lấy mẫu vectơ xác suất từ ​​phân phối Dirichlet có nghĩa là gì?


8

Về cơ bản, tôi đang tìm hiểu về Phân bổ Dirichlet tiềm ẩn. Tôi đang xem video tại đây: http://videolectures.net/mlss09uk_blei_tm/ và bị kẹt ở phút 45 khi anh ấy bắt đầu giải thích về việc lấy mẫu từ bản phân phối.

Ngoài ra, tôi đã cố gắng tham khảo một cuốn sách học máy không có phần giới thiệu chi tiết về phân phối Dirichelt. Trong cuốn sách tôi đang đọc, nó đã đề cập đến một ví dụ về lấy mẫu "vectơ xác suất" từ phân phối Dirichlet, nhưng điều đó có nghĩa là gì?

Tôi hiểu việc lấy mẫu từ một phân phối là nhận các giá trị ngẫu nhiên cho các biến ngẫu nhiên theo phân phối. Vì vậy, hãy để p_X, Y (x, y) nhưng pmf của bất kỳ phân phối nào, lấy mẫu từ distribuiton này có nghĩa là tôi nhận được một ngẫu nhiên (x, y) (tức là các giá trị ngẫu nhiên cho x và y). Để có được xác suất của việc nhận sự kiện (X = x AND Y = y), chúng tôi đánh giá lại pmf của phân phối ... vì vậy chúng tôi chỉ nhận được một số. Nhưng "vectơ xác suất" ở đây là gì !!

Tôi đính kèm một ảnh chụp màn hình cho cuốn sách. Tôi thực sự hy vọng bạn có thể giúp đỡ!

nhập mô tả hình ảnh ở đây


2
Tôi đoán vectơ xác suất chỉ là những gì bạn lấy mẫu với phân phối Dirichlet. Ví dụ: (0,5, 0,4, 0,1) là một vectơ và được sử dụng để biểu diễn tỷ lệ / xác suất của phân phối một biến có 3 lớp.
Cào

@Scratch khi bạn nói 3 lớp, điều đó có nghĩa là một biến ngẫu nhiên chỉ được xác định trên 3 giá trị riêng biệt, phải không?
Jack Twain

1
Vì vậy, về cơ bản mỗi mẫu từ một dirichlet đại diện cho một phân phối trên các lớp K.
Jack Twain

2
vâng, phân phối Dirichlet đã được tạo cho các loại vấn đề này: mô phỏng phân phối trên các lớp.
Cào

@Scratch bạn có thể vui lòng xem câu hỏi của tôi ở đây stats.stackexchange.com/questions/81136/ Khăn
Jack Twain

Câu trả lời:


8

Một phân phối Dirichlet thường được sử dụng để phân loại xác suất các sự kiện giữa một số loại. Giả sử rằng các sự kiện thời tiết có một phân phối Dirichlet. Sau đó, chúng ta có thể nghĩ rằng thời tiết ngày mai có xác suất nắng bằng 0,25, xác suất mưa bằng 0,5 và xác suất tuyết bằng 0,25. Thu thập các giá trị này trong một vectơ tạo ra một vectơ xác suất.

Một cách khác để suy nghĩ về phân phối Dirichlet là quá trình phá vỡ một cây gậy. Hãy tưởng tượng một thanh có chiều dài đơn vị. Phá vỡ thanh đó ở bất cứ đâu và giữ lại một trong hai mảnh. Sau đó chia mảnh còn lại thành hai mảnh và tiếp tục điều này miễn là bạn muốn. Tất cả các phần cùng nhau phải tổng hợp theo chiều dài đơn vị và việc phân bổ các phần có độ dài khác nhau cho các sự kiện khác nhau thể hiện xác suất của sự kiện đó.

Nếu bạn quen thuộc với bản phân phối beta, bản phân phối Dirichlet có thể trở nên rõ ràng hơn nữa. Một bản phân phối beta thường được sử dụng để mô tả phân phối xác suất của các sự kiện phân đôi, do đó, nó bị giới hạn trong khoảng đơn vị. Ví dụ: đối với thử nghiệm Bernoulli, chỉ có một tham số mô tả xác suất của "thành công". Thông thường chúng ta nghĩ rằng là cố định, nhưng nếu chúng ta không chắc chắn về giá trị "thật" của , chúng ta có thể nghĩ về việc phân phối tất cả các có thể , với khả năng lớn hơn cho những người mà chúng ta cho là hợp lý hơn, vì vậy có lẽ , trong đóθ θ θ θ B ( α , β ) α > β β > αθθθθθB(α,β)α>ββ>α tập trung nhiều hơn khối lượng gần 0.

Người ta có thể phản đối rằng phân phối beta chỉ mô tả xác suất của một xác suất duy nhất, ví dụ: , là số vô hướng. Nhưng hãy nhớ rằng bản phân phối beta đang mô tả các kết quả phân đôi . Vì vậy, bằng cách áp dụng tiên đề thứ hai của Kolmogorov, chúng ta cũng biết rằng là tốt. Thu thập các kết quả này trong một vectơ cho chúng ta một vectơ xác suất.P ( θ 0,25 ) = 0,5P(θ<0.25)=0.5P(θ0.25)=0.5

Việc mở rộng phân phối beta thành ba hoặc nhiều loại cho chúng tôi phân phối Dirichlet; thật vậy, bản PDF của Dirichlet cho hai nhóm hoàn toàn giống với bản phân phối beta.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.