Cho một tập hợp các điểm dữ liệu trong đó chúng tôi chạy K- trên và thu được các cụm .x i ∈ R d X c 1 , c 2 , Hoài , c k
Bây giờ, nếu chúng ta tạo một tập dữ liệu mới trong đó và và chạy K- trên để nhận cụm .y i = A x i + b y i ∈ R d Y g 1 , g 2 , ... g k
Trong những điều kiện của và chúng tôi có được đảm bảo để có được các cụm giống nhau không?b
Giả sử rằng K-mean đang sử dụng khoảng cách euclide và có cùng điều kiện ban đầu trên cả hai thuật toán, nghĩa là, nếu các trung tâm ban đầu cho X là thì các trung tâm ban đầu cho Y là trong đó . g 0 1 , Mạnh , g 0 k g 0 i = A c 0 i + b
Cho đến nay tôi đã nghĩ rằng phải có thứ hạng đầy đủ và có thể là bất kỳ vectơ nào. Tuy nhiên, tôi đã không thể chứng minh điều đó.b