Đối với việc học tập không giám sát (như phân cụm), có số liệu nào để đánh giá hiệu suất không?
Đối với việc học tập không giám sát (như phân cụm), có số liệu nào để đánh giá hiệu suất không?
Câu trả lời:
Trong một số ý nghĩa tôi nghĩ rằng câu hỏi này là không thể trả lời. Tôi nói điều này bởi vì một phương pháp không giám sát cụ thể thực hiện tốt như thế nào phần lớn sẽ phụ thuộc vào lý do tại sao người ta thực hiện việc học tập không giám sát ở nơi đầu tiên, tức là phương pháp đó có thực hiện tốt trong bối cảnh mục tiêu cuối cùng của bạn không? Rõ ràng điều này không hoàn toàn đúng, mọi người làm việc với những vấn đề này và công bố kết quả bao gồm một số loại đánh giá. Tôi sẽ phác thảo một vài cách tiếp cận mà tôi quen thuộc dưới đây.
Một tài nguyên tốt (có tài liệu tham khảo) để phân cụm là trang tài liệu của sklearn, Đánh giá hiệu suất phân cụm . Điều này bao gồm một số phương pháp, nhưng tất cả trừ một, Hệ số Silhouette, giả định nhãn sự thật mặt đất có sẵn. Phương pháp này cũng được đề cập trong câu hỏi Đánh giá biện pháp phân cụm , được liên kết trong các ý kiến cho câu hỏi này.
Nếu phương pháp học tập không giám sát của bạn là xác suất, thì một lựa chọn khác là đánh giá một số biện pháp xác suất (khả năng đăng nhập, sự bối rối, v.v.) trên dữ liệu được tổ chức. Động lực ở đây là nếu phương pháp học tập không giám sát của bạn gán xác suất cao cho dữ liệu tương tự không được sử dụng để phù hợp với các tham số, thì có lẽ nó đã thực hiện tốt việc nắm bắt phân phối lợi ích. Một miền mà loại đánh giá này thường được sử dụng là mô hình hóa ngôn ngữ.
Tùy chọn cuối cùng tôi sẽ đề cập là sử dụng một người học được giám sát trong một nhiệm vụ phụ trợ liên quan. Nếu phương pháp không giám sát của bạn tạo ra các biến tiềm ẩn, bạn có thể nghĩ các biến tiềm ẩn này là đại diện cho đầu vào. Do đó, có thể sử dụng các biến tiềm ẩn này làm đầu vào cho phân loại được giám sát thực hiện một số tác vụ liên quan đến miền mà dữ liệu được lấy từ đó. Hiệu suất của phương pháp được giám sát sau đó có thể đóng vai trò thay thế cho hiệu suất của người học không được giám sát. Đây thực chất là thiết lập mà bạn thấy trong hầu hết các công việc về học tập đại diện.
Mô tả này có lẽ hơi mơ hồ, vì vậy tôi sẽ đưa ra một ví dụ cụ thể. Gần như tất cả các công việc về học tập đại diện từ sử dụng cách tiếp cận sau đây để đánh giá:
Để biết ví dụ về cách tiếp cận này trong thực tế, hãy xem bài viết Đào tạo hạn chế các máy Boltzmann về Quan sát từ của Dahl et al.