Làm cách nào để tiếp cận vấn đề phân loại trong đó một trong các lớp được định nghĩa bởi 'không phải bất kỳ lớp nào khác'


9

Giả sử rằng tôi quan tâm đến ba lớp , , . Nhưng tập dữ liệu của tôi thực sự chứa nhiều lớp thực hơn .c1c2c3(cj)j=4n

Câu trả lời rõ ràng là định nghĩa một lớp mới đề cập đến tất cả các lớp , nhưng tôi nghi ngờ đây không phải là một ý tưởng hay vì các mẫu trong sẽ rất hiếm và không giống nhau.c^4cjj>3c^4

Để hình dung những gì tôi đang cố gắng để nói, giả sử tôi có sau hai không gian khác nhau và các lớp c1 , c2 , c3 , c^4=j=4ncj được mô tả trong màu đỏ, đến khi, xanh lá cây và màu đen tương ứng. Đây là cách tôi nghi ngờ dữ liệu của mình sẽ như thế nào.

nhập mô tả hình ảnh ở đây

Có cách nào chuẩn để tiếp cận vấn đề này không? Điều gì sẽ là phân loại hiệu quả nhất và tại sao?


Cân nhắc sử dụng một so với phần còn lại en.wikipedia.org/wiki/Multiclass_ classification
DaL

1
Bạn có thể muốn khám phá các mô hình tích cực không nhãn . Có vẻ như một vấn đề tương tự, ngoại trừ nó là đa sắc, không phải là nhị phân như hầu hết các vấn đề PU.
Ricardo Cruz

Câu trả lời:


4

Tôi sẽ sử dụng cách tiếp cận hai bước, sử dụng ý tưởng của lớp mà bạn đã đề cập.c4^

Trong bước đầu tiên, sử dụng trình phân loại nhị phân (được đào tạo trên toàn bộ tập dữ liệu) để quyết định xem một mẫu có thuộc về lớp (tức là trong bất kỳ lớp không thú vị nào). Đối với điều này, bước bạn cũng có thể xem qua các phương pháp phát hiện ngoại lệ , nếu các mẫu thuộc các lớp "thú vị" khác nhiều so với phần còn lại.c4^

Nếu kết quả là âm tính, hãy chuyển sang bước tiếp theo, một trình phân loại mới chỉ được đào tạo về các mẫu thuộc các lớp và sử dụng dự đoán đó làm dự đoán cuối cùng của bạn.c1,c2,c3

Tôi nghĩ rằng ngay cả khi sử dụng cách tiếp cận phân cụm đơn giản như bước đầu tiên (ví dụ: 4 cụm k có nghĩa là sử dụng làm giá trị centroid ban đầu, centroid cho mỗi ), vẫn sẽ hữu ích.centj=xiD:yi=jxixiD:yi=j1c1,c2,c3,c4^


Đề xuất của Bogas là tuyệt vời nếu bạn không có nhiều lớp học chồng chéo. Nếu không, đi với một mô hình đa nhãn.
Ricardo Cruz

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.