Người ta biết rằng thuật toán k-mean chịu sự hiện diện của các ngoại lệ. k-mean ++ là một phương pháp hiệu quả để khởi động trung tâm cụm. Tôi đã trải qua PPT bởi những người sáng lập phương pháp, Sergei Vassilvitskii và David Arthur http://theory.stanford.edu/~sergei/slides/BATS-Means.pdf (slide 28) cho thấy việc khởi tạo trung tâm cụm là không bị ảnh hưởng bởi ngoại lệ như được thấy dưới đây.
Theo phương pháp k-mean ++, các điểm xa nhất có nhiều khả năng là trung tâm ban đầu. Theo cách này, điểm ngoại lệ (điểm ngoài cùng bên phải) cũng phải là một trọng tâm cụm ban đầu. Giải thích cho hình là gì?