Tôi có một thuật toán phân cụm (không phải k-nghĩa) với tham số đầu vào (số lượng cụm). Sau khi thực hiện phân cụm, tôi muốn có được một số đo định lượng về chất lượng của phân cụm này. Thuật toán phân cụm có một thuộc tính quan trọng. Với nếu tôi cung cấp điểm dữ liệu mà không có sự phân biệt đáng kể nào giữa chúng với thuật toán này, kết quả là tôi sẽ nhận được một cụm chứa điểm dữ liệu và một cụm có điểm dữ liệu. Rõ ràng đây không phải là điều tôi muốn. Vì vậy, tôi muốn tính toán thước đo chất lượng này để ước tính tính hợp lý của cụm này. Lý tưởng nhất là tôi sẽ có thể so sánh các biện pháp này cho khác nhau . Vì vậy, tôi sẽ chạy phân cụm trong phạm vik = 2 N N - 1 1 k kvà chọn một trong những chất lượng tốt nhất. Làm thế nào để tôi tính toán đo lường chất lượng như vậy?
CẬP NHẬT:
Đây là một ví dụ khi là một cụm xấu. Giả sử có 3 điểm trên một mặt phẳng tạo thành tam giác đều. Chia các điểm này thành 2 cụm rõ ràng là tồi tệ hơn so với việc chia chúng thành 1 hoặc 3 cụm.