Tổng ss và giữa ss có nghĩa là gì trong cụm k-nghĩa?


10

Tôi rất mới để phân tích cụm. Tôi đang sử dụng R cho cụm k-nghĩa và tôi tự hỏi những thứ đó là gì. Và điều gì là tốt hơn nếu tỷ lệ của họ nhỏ hơn hoặc lớn hơn?

Câu trả lời:


12

Về cơ bản, nó là thước đo mức độ tốt của phân loại k-nghĩa đã được tìm thấy. SS rõ ràng là viết tắt của Sum of Squares, do đó, đó là sự phân rã thông thường của sự lệch lạc trong "lệch lạc" và lệch lạc "Trong". Lý tưởng nhất là bạn muốn một cụm có các thuộc tính của sự gắn kết bên trong và tách biệt bên ngoài, tức là tỷ lệ BSS / TSS nên tiếp cận 1.

Ví dụ: trong R:

data(iris)
km <- kmeans(iris[,1:4], 3)

cho tỷ lệ BSS / TSS là 88,4% (0,884) cho thấy sự phù hợp tốt. Bạn nên cẩn thận, và thường là một ý tưởng tốt để vẽ WSS theo số cụm, vì số này phải được chỉ định trước.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.