Câu hỏi được gắn thẻ «k-means»

k-mean là phương pháp phân vùng dữ liệu thành các cụm bằng cách tìm một số phương tiện xác định, k, st khi dữ liệu được gán cho các cụm với giá trị trung bình gần nhất, tổng bình phương của cụm w / i được thu nhỏ

2
Tại sao chỉ có giá trị trung bình được sử dụng trong phương pháp phân cụm (K-mean)?
Trong các phương pháp phân cụm như K- mean, khoảng cách euclide là số liệu cần sử dụng. Do đó, chúng tôi chỉ tính các giá trị trung bình trong mỗi cụm. Và sau đó điều chỉnh được thực hiện trên các yếu tố dựa trên khoảng cách của chúng …


1
Có hợp lệ để thực hiện phương tiện k trên ma trận khoảng cách như trên ma trận dữ liệu (dữ liệu khai thác văn bản) không?
(Bài đăng này là một bài đăng lại câu hỏi tôi đã đăng ngày hôm qua (hiện đã bị xóa), nhưng tôi đã cố gắng thu nhỏ lại khối lượng từ và đơn giản hóa những gì tôi đang hỏi) Tôi hy vọng sẽ nhận được một số trợ giúp …

2
thuật toán k-mean ++ và các ngoại lệ
Người ta biết rằng thuật toán k-mean chịu sự hiện diện của các ngoại lệ. k-mean ++ là một phương pháp hiệu quả để khởi động trung tâm cụm. Tôi đã trải qua PPT bởi những người sáng lập phương pháp, Sergei Vassilvitskii và David Arthur http://theory.stanford.edu/~sergei/slides/BATS-Means.pdf (slide 28) cho …
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.