Tôi có một câu hỏi rất cơ bản về phân cụm. Sau khi tôi đã tìm thấy k cụm với trọng tâm của chúng, làm thế nào để tôi diễn giải các lớp của các điểm dữ liệu mà tôi đã phân cụm (gán nhãn lớp có ý nghĩa cho mỗi cụm). Tôi không nói về việc xác nhận các cụm được tìm thấy.
Có thể thực hiện được một tập hợp các điểm dữ liệu được dán nhãn nhỏ, tính toán cụm điểm mà các điểm được gắn nhãn này thuộc về loại nào và dựa trên loại và số điểm mà mỗi cụm nhận được, quyết định nhãn? Điều này có vẻ khá rõ ràng nhưng tôi không biết việc gán nhãn cho các cụm theo cách này là chuẩn như thế nào.
Để rõ ràng, tôi muốn thực hiện phân cụm không giám sát mà không sử dụng bất kỳ nhãn nào để tìm cụm đầu tiên của tôi. Sau đó, khi tìm thấy các cụm, tôi muốn gán nhãn lớp có ý nghĩa cho các cụm dựa trên các thuộc tính của một vài biểu dữ liệu mẫu.