Tôi đã đọc một vài lời giải thích về thuật toán EM (ví dụ từ Nhận dạng mẫu và Học máy của Giám mục và từ Khóa học đầu tiên của Roger và Gerolami về Học máy). Đạo hàm của EM là ok, tôi hiểu nó. Tôi cũng hiểu lý do tại sao thuật toán bao phủ một thứ gì đó: ở mỗi bước chúng tôi cải thiện kết quả và khả năng bị giới hạn bởi 1.0, vì vậy bằng cách sử dụng một thực tế đơn giản (nếu một hàm tăng và bị chặn thì nó hội tụ) chúng tôi biết rằng thuật toán hội tụ một số giải pháp.
Tuy nhiên, làm thế nào để chúng ta biết nó là tối thiểu địa phương? Ở mỗi bước, chúng tôi chỉ xem xét một tọa độ (biến tiềm ẩn hoặc tham số), vì vậy chúng tôi có thể bỏ lỡ điều gì đó, như là mức tối thiểu cục bộ yêu cầu di chuyển bằng cả hai tọa độ cùng một lúc.
Điều này tôi tin là một vấn đề tương tự như của các thuật toán leo đồi nói chung, mà EM là một ví dụ. Vì vậy, đối với thuật toán leo đồi nói chung, chúng ta có vấn đề này cho hàm f (x, y) = x * y. Nếu chúng ta bắt đầu từ (0, 0) điểm, thì chỉ bằng cách xem xét cả hai hướng cùng một lúc chúng ta có thể di chuyển lên từ giá trị 0.