Trong bối cảnh học máy, sự khác biệt giữa học tập không giám sát học có giám sát và học bán giám sát? Và một số cách tiếp cận thuật toán chính để xem xét là gì?
Tôi đang đọc báo cáo về giải pháp chiến thắng của một cuộc thi Kaggle ( Phân loại phần mềm độc hại ). Các báo cáo có thể được tìm thấy trong bài diễn đàn này . Vấn đề là một vấn đề phân loại (chín lớp, số liệu là …
Để đơn giản, giả sử tôi đang làm việc với ví dụ cổ điển về email spam / không phải thư rác. Tôi có một bộ 20000 email. Trong số này, tôi biết rằng 2000 là thư rác nhưng tôi không có ví dụ nào về email không phải thư …
Tôi đã xem xét các phương pháp học bán giám sát và đã bắt gặp khái niệm "dán nhãn giả". Theo tôi hiểu, với việc gắn nhãn giả, bạn có một bộ dữ liệu được gắn nhãn cũng như một bộ dữ liệu chưa được gắn nhãn. Trước tiên, bạn …
Từ những gì tôi đã đọc: Giám sát xa : A Distant supervision algorithm usually has the following steps: 1] It may have some labeled training data 2] It "has" access to a pool of unlabeled data 3] It has an operator that allows it to sample from this unlabeled …
Tôi muốn tìm hiểu (suy luận) trọng số thuộc tính cho thước đo độ không giống nhau của tôi mà tôi có thể sử dụng để phân cụm. Tôi có một số ví dụ của các cặp đối tượng "tương tự" (nên nằm trong cùng một cụm), cũng như một …
Tôi đã đọc những bình luận tuyệt vời về cách xử lý các giá trị bị thiếu trước khi áp dụng SVD, nhưng tôi muốn biết nó hoạt động như thế nào với một ví dụ đơn giản: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 …
Câu hỏi của tôi là: Làm thế nào chúng ta có thể sử dụng dữ liệu đầu ra được đo một phần trong tập huấn luyện? Điều này là mơ hồ, vì vậy tôi cụ thể hóa nó trong một câu chuyện hay thay đổi. Loài sóc có hạt, nhưng …
Tôi đang làm việc với một nhiệm vụ học tập có giám sát, trong đó tôi chỉ có dữ liệu tích cực và không ghi nhãn (học PU). Tôi đã thử nghiệm một vài thuật toán và muốn đánh giá hiệu suất của chúng. Đối với việc học có giám …