Về nguyên tắc, cả EM và các phương pháp tối ưu hóa tiêu chuẩn đều có thể hoạt động để phân phối hỗn hợp phù hợp. Giống như EM, bộ giải tối ưu hóa lồi sẽ hội tụ đến mức tối ưu cục bộ. Nhưng, một loạt các thuật toán tối ưu hóa tồn tại để tìm kiếm các giải pháp tốt hơn với sự hiện diện của nhiều tối ưu cục bộ. Theo như tôi biết, thuật toán có tốc độ hội tụ tốt nhất sẽ phụ thuộc vào vấn đề.
Một lợi ích của EM là nó tự nhiên tạo ra các tham số hợp lệ cho phân phối hỗn hợp trên mỗi lần lặp. Ngược lại, các thuật toán tối ưu hóa tiêu chuẩn sẽ cần các ràng buộc được áp đặt. Ví dụ: giả sử bạn đang lắp mô hình hỗn hợp Gaussian. Một cách tiếp cận lập trình phi tuyến chuẩn sẽ yêu cầu các ma trận hiệp phương sai ràng buộc là bán chính xác dương và ràng buộc các trọng số thành phần hỗn hợp là không âm và tổng thành một.
Để đạt được hiệu suất tốt đối với các vấn đề chiều cao, một bộ giải lập trình phi tuyến thường cần khai thác gradient. Vì vậy, bạn phải lấy ra độ dốc hoặc tính toán nó với sự khác biệt tự động. Các lớp cũng cần thiết cho các hàm ràng buộc nếu chúng không có dạng chuẩn. Phương pháp của Newton và các phương pháp liên quan (ví dụ: phương pháp vùng tin cậy) cũng cần Hessian. Phương pháp khác biệt hữu hạn hoặc phương pháp không có đạo hàm có thể được sử dụng nếu độ dốc không khả dụng, nhưng hiệu suất có xu hướng mở rộng kém khi số lượng tham số tăng. Ngược lại, EM không yêu cầu độ dốc.
EM là khái niệm trực quan, đó là một đức tính tuyệt vời. Điều này thường giữ cho phương pháp tối ưu hóa tiêu chuẩn là tốt. Có nhiều chi tiết thực hiện, nhưng khái niệm tổng thể là đơn giản. Người ta thường có thể sử dụng các bộ giải tối ưu hóa tiêu chuẩn để trừu tượng hóa các chi tiết này dưới mui xe. Trong những trường hợp này, người dùng chỉ cần cung cấp hàm mục tiêu, các ràng buộc và độ dốc và có đủ kiến thức làm việc để chọn một bộ giải phù hợp với vấn đề. Nhưng, kiến thức chuyên ngành chắc chắn là cần thiết nếu nó đạt đến điểm mà người dùng phải suy nghĩ hoặc thực hiện các chi tiết cấp thấp của thuật toán tối ưu hóa.
Một lợi ích khác của thuật toán EM là nó có thể được sử dụng trong trường hợp thiếu một số giá trị dữ liệu.
Cũng được quan tâm (bao gồm cả các ý kiến):