Giải thích tự nhiên cho siêu âm LDA


21

Ai đó có thể giải thích sự giải thích tự nhiên cho siêu âm LDA là gì? ALPHABETAlà các tham số của phân phối Dirichlet cho chủ đề (trên mỗi tài liệu) và phân phối từ (theo chủ đề) tương ứng. Tuy nhiên, ai đó có thể giải thích ý nghĩa của việc chọn giá trị lớn hơn của các siêu đường kính này so với các giá trị nhỏ hơn không? Điều đó có nghĩa là đặt bất kỳ niềm tin trước nào về sự thưa thớt của chủ đề vào tài liệu và loại trừ lẫn nhau của các chủ đề về mặt từ ngữ?

Câu hỏi này là về phân bổ Dirichlet tiềm ẩn, nhưng nhận xét của BGReene ngay bên dưới đề cập đến phân tích phân biệt tuyến tính, điều khó hiểu cũng được viết tắt là LDA.


Tôi nghĩ bạn cần cung cấp thêm một số chi tiết về công thức LDA mà bạn đang sử dụng. Nói chung, chỉ có các mô hình RDA có các tham số đó, LDA thường được xác định hoàn toàn bởi vectơ trung bình, ma trận hiệp phương sai và xác suất trước.
BGreene

Câu trả lời:


11

David Blei có một bài nói chuyện tuyệt vời giới thiệu LDA cho các sinh viên của một lớp học mùa hè: http://videolectures.net/mlss09uk_blei_tm/

Trong video đầu tiên , anh ấy trình bày rộng rãi ý tưởng cơ bản về mô hình chủ đề và cách phân phối Dirichlet ra đời. Ký hiệu tấm được giải thích như thể tất cả các biến ẩn được quan sát để hiển thị các phụ thuộc. Về cơ bản các chủ đề là phân phối trên các từ và phân phối tài liệu theo các chủ đề.

Trong video thứ hai , ông cho thấy hiệu ứng của alpha với một số biểu đồ mẫu. Alpha càng nhỏ thì phân phối càng thưa thớt. Ngoài ra, ông giới thiệu một số phương pháp suy luận.


7
đây không phải là câu trả lời được chấp nhận
samsamara

Tôi đoán là bạn đúng. Tôi hoàn toàn quên rằng tôi đã viết này.
Karsten

Oh! không mong đợi để xem một bình luận từ tác giả! hehe :)
samsamara

48

Câu trả lời phụ thuộc vào việc bạn đang giả sử phân phối dirichlet đối xứng hay không đối xứng (hoặc, về mặt kỹ thuật hơn, liệu số đo cơ sở có đồng nhất hay không). Trừ khi có một cái gì đó được chỉ định, hầu hết các triển khai LDA đều cho rằng phân phối là đối xứng.

Đối với phân phối đối xứng, giá trị alpha cao có nghĩa là mỗi tài liệu có khả năng chứa hỗn hợp của hầu hết các chủ đề và không có bất kỳ chủ đề cụ thể nào. Giá trị alpha thấp đặt ít ràng buộc như vậy hơn vào tài liệu và có nghĩa là nhiều khả năng tài liệu có thể chứa hỗn hợp chỉ một vài hoặc thậm chí chỉ một trong các chủ đề. Tương tự, giá trị beta cao có nghĩa là mỗi chủ đề có khả năng chứa hỗn hợp của hầu hết các từ và không có từ nào cụ thể, trong khi giá trị thấp có nghĩa là một chủ đề có thể chứa hỗn hợp chỉ một vài từ.

Mặt khác, nếu phân phối không đối xứng, giá trị alpha cao có nghĩa là phân phối chủ đề cụ thể (tùy thuộc vào thước đo cơ sở) có nhiều khả năng cho mỗi tài liệu. Tương tự, giá trị beta cao có nghĩa là mỗi chủ đề có nhiều khả năng chứa một hỗn hợp từ cụ thể được xác định bởi thước đo cơ sở.

Trong thực tế, giá trị alpha cao sẽ dẫn đến các tài liệu giống nhau hơn về chủ đề chúng chứa. Giá trị beta cao sẽ tương tự dẫn đến các chủ đề giống nhau hơn về các từ mà chúng chứa.

Vì vậy, vâng, các tham số alpha xác định niềm tin trước đó về độ thưa / tính đồng nhất của chủ đề trong các tài liệu. Mặc dù vậy, tôi không hoàn toàn chắc chắn ý của bạn là "loại trừ lẫn nhau các chủ đề về mặt từ ngữ".


Tổng quát hơn, đây là các tham số nồng độ cho phân phối dirichlet được sử dụng trong mô hình LDA. Để có được sự hiểu biết trực quan về cách thức hoạt động của nó, bài thuyết trình này chứa một số hình ảnh minh họa đẹp, cũng như một lời giải thích tốt về LDA nói chung.


Một nhận xét bổ sung tôi sẽ đặt ở đây, vì tôi không thể nhận xét về câu hỏi ban đầu của bạn: Từ những gì tôi đã thấy, các tham số alpha và beta có thể hơi khó hiểu khi tham khảo một số tham số khác nhau. Phân phối dirichlet cơ bản thường được tham số hóa với vectơ , nhưng điều này có thể được phân tách thành thước đo cơ bản và nồng độ tham số , sao cho . Trong trường hợp tham số alpha là vô hướng, thường có nghĩa là tham số nồng độ , nhưng nó cũng có thể có nghĩa là các giá trị của(α1,α2,...,αK)bạn= =(bạn1,bạn2,...,bạnK)αα*bạn= =(α1,α2,...,αK)α(α1,α2,...,αK), vì chúng sẽ bằng nhau dưới phân phối dirichlet đối xứng. Nếu đó là một vectơ, nó thường đề cập đến . Tôi không chắc chắn tham số nào là phổ biến nhất, nhưng trong câu trả lời của tôi, tôi cho rằng bạn có nghĩa là các giá trị alpha và beta là các tham số nồng độ.(α1,α2,...,αK)


2
+1 câu trả lời thông tin! Tôi muốn hỏi làm thế nào cao / thấp là giá trị cao / thấp cho alpha và beta nói chung?
samsamara

Beta được cho là một bản phân phối các từ cho mỗi chủ đề (một ma trận), phải không? Vậy làm thế nào để một giá trị duy nhất chuyển thành ma trận?
Noamiko

Tôi có đúng không khi kết luận rằng alpha cao có nghĩa là các tài liệu tương tự nhau và beta cao có nghĩa là các chủ đề tương tự nhau?
Lewistrick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.