Theo như tôi biết, "trung bình" của một cụm và tâm của một cụm là giống nhau, mặc dù thuật ngữ "centroid" có thể chính xác hơn một chút so với "trung bình" khi xử lý dữ liệu đa biến.
Để tìm trọng tâm, người ta tính riêng trung bình (số học) của các vị trí của các điểm cho từng thứ nguyên. Ví dụ: nếu bạn có điểm tại:
- (-1, 10, 3),
- (0, 5, 2) và
- (1, 20, 10),
sau đó trọng tâm sẽ được đặt tại ((-1 + 0 + 1) / 3, (10 + 5 + 20) / 3, (3 + 2 + 10) / 3), giúp đơn giản hóa (0, 11 2/3, 5). (NB: Trọng tâm không phải là - và hiếm khi là --- một trong những điểm dữ liệu gốc)
Trọng tâm đôi khi cũng được gọi là trung tâm khối lượng hoặc barycenter, dựa trên sự giải thích vật lý của nó (nó là trung tâm khối lượng của một vật thể được xác định bởi các điểm). Giống như giá trị trung bình, vị trí của trung tâm giảm thiểu khoảng cách bình phương từ các điểm khác.
Một ý tưởng liên quan là medoid , là điểm dữ liệu "ít khác biệt nhất" từ tất cả các điểm dữ liệu khác. Không giống như trung tâm, medoid phải là một trong những điểm ban đầu. Bạn cũng có thể quan tâm đến trung vị hình học phù hợp với trung vị, nhưng đối với dữ liệu đa biến. Cả hai đều khác với centroid.
ABcentroid(A)centroid(B)aiAdist(ai,b1)dist(ai,b2)dist(ai,bn)