Trong các phương pháp phân cụm như K- mean, khoảng cách euclide là số liệu cần sử dụng. Do đó, chúng tôi chỉ tính các giá trị trung bình trong mỗi cụm. Và sau đó điều chỉnh được thực hiện trên các yếu tố dựa trên khoảng cách của chúng với từng giá trị trung bình.
Tôi đã tự hỏi tại sao hàm Gaussian không được sử dụng làm số liệu? Thay vì sử dụng xi -mean(X)
, chúng ta có thể sử dụng exp(- (xi - mean(X)).^2/std(X).^2)
. Do đó, không chỉ độ tương tự giữa các cụm được đo (trung bình), mà độ tương tự trong cụm cũng được xem xét (std). Đây có phải cũng tương đương với mô hình hỗn hợp Gaussian ?
Nó nằm ngoài câu hỏi của tôi ở đây nhưng tôi nghĩ rằng sự thay đổi trung bình có thể phát sinh cùng một câu hỏi ở trên.