Thông báo sau bảng ANOVA sau phân tích K-mean chỉ ra rằng các mức ý nghĩa không nên được xem là thử nghiệm của các phương tiện bằng nhau, vì giải pháp cụm đã được rút ra dựa trên khoảng cách Euclide để tối đa hóa khoảng cách. Tôi nên sử dụng thử nghiệm nào để chỉ ra liệu phương tiện của các biến phân cụm có khác nhau giữa các cụm không? Tôi đã thấy cảnh báo này trong bảng ANOVA do k-mean cung cấp, nhưng trong một số tài liệu tham khảo tôi thấy rằng các bài kiểm tra ANOVA hậu hoc đang chạy. Tôi có nên bỏ qua các đầu ra ANOVA có nghĩa là k và chạy ANOVA một chiều với các bài kiểm tra hậu hoc và diễn giải chúng theo cách truyền thống không? Hoặc tôi chỉ có thể ngụ ý về độ lớn của giá trị F và biến nào đóng góp nhiều hơn cho sự khác biệt? Một nhầm lẫn khác là các biến phân cụm không được phân phối bình thường vi phạm giả định ANOVA, sau đó tôi có thể sử dụng thử nghiệm không tham số Kruskal-Wallis, nhưng nó có giả định về các phân phối tương tự. Các phân phối giữa các cụm cho các biến cụ thể có vẻ không giống nhau, một số bị lệch dương, một số bị phủ định ... Tôi có 1275 mẫu lớn, 5 cụm, 10 biến phân cụm được đo bằng điểm PCA.