Khi nào nên sử dụng mô hình hỗn hợp Gaussian?


9

Tôi mới sử dụng GMM. Tôi không thể tìm thấy bất kỳ trợ giúp thích hợp trực tuyến. Bất cứ ai cũng có thể vui lòng cung cấp cho tôi tài nguyên đúng về "Cách quyết định xem việc sử dụng GMM có phù hợp với vấn đề của tôi không?" hoặc trong trường hợp có vấn đề về phân loại "Làm thế nào để quyết định xem tôi có phải sử dụng phân loại SVM hoặc phân loại GMM không?"


tập dữ liệu của bạn là gì và vấn đề chính xác của bạn là gì? Nó được sử dụng khi dữ liệu theo sau (là hỗn hợp của) nhiều hơn 1 phân phối bình thường. Xem một câu hỏi khác - stats.stackexchange.com/questions/236295/ Kẻ
Arpit Sisodia

Bạn có thể nghĩ về nó như một hình thức phân cụm trong đó bạn không gắn nhãn dữ liệu và tin rằng các nhóm tiềm ẩn là đa biến hoàn toàn bình thường.
gung - Phục hồi Monica

@ arpit-sisodia, Chúng tôi đang nghiên cứu tính khả thi của thiết lập bàn phím phần cứng dường như có các tính năng cụ thể và chúng tôi đang lên kế hoạch mô hình hóa nó bằng GMM. Chúng tôi không biết rõ quy trình cơ bản và do đó chúng tôi đang cố gắng mô hình hóa bằng các phương pháp học máy. Vì vậy, chúng tôi không chắc chắn liệu thực sự có một hỗn hợp gaussian trong quy trình cơ bản hay không. Hơn nữa, nó là đa chiều và chúng ta không thể hình dung nó để xem nó có phải là hỗn hợp của gaussian hay không
Vinay

@ arpit-sisodia, Liên kết bạn đã cung cấp gợi ý thêm về phương pháp dùng thử và lỗi để xem GMM có phù hợp với dữ liệu của tôi không. Có một cách kết luận / quy tắc Thumb để quyết định các mô hình sẽ sử dụng. Phương pháp chơi thử và lỗi với nhiều hỗn hợp có thể phù hợp với dữ liệu của tôi. Nhưng có một cách nhất định để quyết định? Giống như chúng ta cần có sự phân tách tuyến tính của dữ liệu để phân loại SVM
Vinay

Câu trả lời:


4

Theo tôi, bạn có thể thực hiện GMM khi bạn biết rằng các điểm dữ liệu là hỗn hợp của phân phối gaussian. Về cơ bản hình thành các cụm với độ lệch trung bình và độ lệch chuẩn khác nhau. Có một sơ đồ đẹp trên trang web scikit-learn. L

Phân loại GMM

Một cách tiếp cận là tìm các cụm bằng các phương pháp phân cụm mềm và sau đó xem chúng có phải là gaussian không. Nếu có thì bạn có thể áp dụng mô hình GMM đại diện cho toàn bộ dữ liệu.


1
thông thường chúng ta không biết liệu các điểm dữ liệu có phải là Hỗn hợp của Gaussian hay không. Vì vậy, đây là phần chơi nhiều hơn với Gaussian và MoG và xem nó có phù hợp không. Nhưng không có hướng dẫn / quy tắc ngón tay cái nào để sử dụng GMM ngay
Vinay

2
Theo kinh nghiệm của tôi, bạn cần tìm mẫu trong dữ liệu là mô hình Hỗn hợp. Một tờ giấy đẹp để đọc sẽ là đây: stat.cmu.edu/~cshalizi/uADA/12/lectures/ch20.pdf
Slayer

0

GMM thường là một nơi tốt để bắt đầu nếu mục tiêu của bạn là (1) quan sát cụm, (2) chỉ định một mô hình tổng quát hoặc (3) mật độ ước tính. Trong thực tế, để phân cụm, GMM là một siêu nhóm của phương tiện k.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.