Quy trình Dirichlet cho việc học có giám sát?


8

Dường như khi tôi liếc quanh đây về các thuật toán học tập thời thượng, những thứ như mạng lưới thần kinh, cây được tăng cường, máy vectơ hỗ trợ, rừng ngẫu nhiên và bạn bè được quảng bá cho các vấn đề học tập có giám sát. Các quy trình Dirichlet và ilk của chúng dường như được đề cập chủ yếu trong các vấn đề học tập không được giám sát, chẳng hạn như phân cụm tài liệu hoặc hình ảnh. Tôi thấy chúng được sử dụng cho các vấn đề hồi quy, hoặc là các linh mục có mục đích chung khi người ta muốn thực hiện thống kê Bayes theo cách không theo tỷ lệ hoặc bán tổng thể (ví dụ như linh hoạt trước khi phân phối các hiệu ứng ngẫu nhiên trong các mô hình nhất định) nhưng kinh nghiệm hạn chế của tôi cho thấy rằng điều này không đến từ đám đông học máy như từ các nhà thống kê truyền thống. Tôi đã thực hiện một số lượng nhỏ về việc này và tôi

Vì vậy, các quy trình Dirichlet và anh em họ của họ có hiệu quả nhất với tư cách là linh mục cho các mô hình phân cụm linh hoạt? Có phải họ không cạnh tranh với việc thúc đẩy, SVM và mạng lưới thần kinh cho các vấn đề học tập có giám sát? Có phải chúng chỉ hữu ích trong các tình huống nhất định cho những vấn đề này? Hay là ấn tượng chung của tôi không chính xác?


Loại hồi quy nào có nghĩa là gì? trong phân phối cơ sở của DP? hoặc trong tham số trộn? Tôi nghĩ rằng bạn sẽ có một thời gian khó khăn để phù hợp với một mô hình như vậy.
xác suất

Hoặc bạn có nghĩa là một số "hồi quy" chung chung trong đó bạn phù hợp với DP đa biến với các phân phối biên và chung.
xác suất

@probabilityislogic phân phối phù hợp được vẽ từ DP đến khớp và sau đó đi lấy các điều kiện là loại điều tôi có trong tâm trí, với các biến thể về chủ đề đó. Mô hình các trọng lượng trong xây dựng phá vỡ thanh là tương tự.
anh chàng

Câu trả lời:


1

Câu hỏi này không nhận được quá nhiều sự chú ý, vì vậy tôi sẽ trả lời để cập nhật những gì tôi đã tìm thấy và (hy vọng) kích thích thảo luận. Tôi đã xem một bài báo tôi mong muốn được đọc sử dụng DPM để phân loại (Shahbaba và Neal, 2007) mà họ đã thử nghiệm trên dữ liệu gấp protein. Về cơ bản, có vẻ như họ đã sử dụng một cái gì đó tương tự như những gì tôi đề xuất trong các ý kiến ​​trên. Nó so sánh thuận lợi với cả mạng thần kinh và máy vectơ hỗ trợ. Điều này là một chút nhẹ nhõm đối với tôi vì tôi đã dành rất nhiều thời gian cho các mô hình này để mắt đến các vấn đề máy học được giám sát nên có vẻ như tôi (có lẽ) đã không lãng phí thời gian của mình.


1

Hãy xem DPpackage của quá trình R. Dirichlet có thể được sử dụng ít nhất là trước cho một hiệu ứng ngẫu nhiên và để xây dựng một phân phối lỗi không theo tỷ lệ cho hồi quy.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.