Tôi đang cố gắng để đánh giá hiệu suất phân cụm. Tôi đã đọc tài liệu skiscit-learn về số liệu . Tôi không hiểu sự khác biệt giữa ARI và AMI. Dường như với tôi rằng họ làm điều tương tự theo hai cách khác nhau.
Trích dẫn từ tài liệu:
Dựa vào kiến thức về các bài tập lớp thực tế nhãn_true và các bài tập thuật toán phân cụm của chúng tôi cho cùng một mẫu nhãn_pred, chỉ số Rand được điều chỉnh là một hàm đo lường sự giống nhau của hai bài tập, bỏ qua hoán vị và bình thường hóa cơ hội.
đấu với
Dựa vào kiến thức về các bài tập lớp thực tế nhãn_true và các bài tập thuật toán phân cụm của chúng tôi cho cùng một mẫu nhãn_pred, Thông tin lẫn nhau là một hàm đo lường sự thỏa thuận của hai bài tập, bỏ qua hoán vị ... AMI đã được đề xuất gần đây và được chuẩn hóa gần đây cơ hội.
Tôi có nên sử dụng cả hai trong số chúng trong đánh giá phân cụm của mình hay điều này sẽ là dư thừa?