Câu trả lời:
Về cơ bản, nó là thước đo mức độ tốt của phân loại k-nghĩa đã được tìm thấy. SS rõ ràng là viết tắt của Sum of Squares, do đó, đó là sự phân rã thông thường của sự lệch lạc trong "lệch lạc" và lệch lạc "Trong". Lý tưởng nhất là bạn muốn một cụm có các thuộc tính của sự gắn kết bên trong và tách biệt bên ngoài, tức là tỷ lệ BSS / TSS nên tiếp cận 1.
Ví dụ: trong R:
data(iris)
km <- kmeans(iris[,1:4], 3)
cho tỷ lệ BSS / TSS là 88,4% (0,884) cho thấy sự phù hợp tốt. Bạn nên cẩn thận, và thường là một ý tưởng tốt để vẽ WSS theo số cụm, vì số này phải được chỉ định trước.