Tôi đang cố gắng để hiểu các phương pháp phân cụm.
Những gì tôi nghĩ tôi đã hiểu:
Trong học tập có giám sát, dữ liệu danh mục / nhãn được gán cho được biết trước khi tính toán. Vì vậy, các nhãn, lớp hoặc danh mục đang được sử dụng để "tìm hiểu" các tham số thực sự có ý nghĩa đối với các cụm đó.
Trong học tập không giám sát, các bộ dữ liệu được gán cho các phân đoạn, mà không có cụm được biết đến.
Điều đó có nghĩa là, nếu tôi thậm chí không biết tham số nào là quan trọng cho phân khúc, tôi nên học có giám sát hơn?