Sự khác biệt giữa vấn đề đa lớp và đa lớp


52

Sự khác biệt giữa một vấn đề đa kính và một vấn đề đa nhãn là gì?


Cả hai tác vụ đều có thể được thực hiện với gói phần mềm Vowpal Wợi (dòng lệnh, liên kết python có sẵn).
Vladislavs Dovgalecs

Tôi đã học được khái niệm này và xây dựng sự hiểu biết của tôi với bài đăng này , họ đã giải thích phân loại đa nhãn theo một cách rất thanh lịch.
dùng235077

Câu trả lời:


45

Tôi nghi ngờ sự khác biệt là trong các vấn đề đa lớp, các lớp loại trừ lẫn nhau, trong khi đối với các vấn đề đa nhãn, mỗi nhãn đại diện cho một nhiệm vụ phân loại khác nhau, nhưng các nhiệm vụ có liên quan đến nhau (vì vậy có một lợi ích trong việc giải quyết chúng cùng nhau chứ không phải riêng rẽ ). Ví dụ, trong bộ dữ liệu cua leptograspus nổi tiếng có các ví dụ về con đực và con cái của hai dạng cua màu. Bạn có thể tiếp cận vấn đề này như một vấn đề đa lớp với bốn lớp (nam-xanh, nữ-xanh, cam-nam, cam-nữ) hoặc là một vấn đề đa nhãn, trong đó một nhãn sẽ là nam / nữ và màu xanh khác /trái cam. Về cơ bản trong các vấn đề đa nhãn, một mẫu có thể thuộc về nhiều hơn một lớp.


@Dirkran Cảm ơn lời giải thích của bạn. Bạn có biết bất kỳ nguồn nào khác mà tôi có thể nhận được bộ dữ liệu đa nhãn khác ngoài csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.htmlmulan.sourceforge.net/datasets.html
Học viên

@Learner xin lỗi, đó không phải là thứ tôi đã làm việc nhiều. Bạn có thể muốn có một cái nhìn về học tập đa tác vụ, có một số điểm tương đồng với học tập đa nhãn hiệu. Có lẽ một số bộ dữ liệu được sử dụng cho điều đó cũng có thể hữu ích như điểm chuẩn cho việc học nhiều nhãn.
Dikran Marsupial

26

Phân loại nhiều lớp có nghĩa là một nhiệm vụ phân loại có nhiều hơn hai lớp; ví dụ: phân loại một tập hợp các hình ảnh của trái cây có thể là cam, táo hoặc lê. Phân loại nhiều lớp đưa ra giả định rằng mỗi mẫu được gán cho một và chỉ một nhãn: một quả có thể là táo hoặc lê nhưng không phải cả hai cùng một lúc.

Phân loại đa nhãn gán cho mỗi mẫu một bộ nhãn đích. Điều này có thể được coi là dự đoán các thuộc tính của điểm dữ liệu không loại trừ lẫn nhau, chẳng hạn như các chủ đề có liên quan đến tài liệu. Một văn bản có thể là về bất kỳ tôn giáo, chính trị, tài chính hoặc giáo dục nào cùng một lúc hoặc không có gì trong số này.

Lấy từ http://scikit-learn.org/urdy/modules/multiclass.html


18

Để bổ sung cho các câu trả lời khác, đây là một số số liệu. Một hàng = sản lượng dự kiến ​​cho một mẫu.

Đa sắc

Một cột = một lớp (mã hóa một nóng)

nhập mô tả hình ảnh ở đây

Đa nhãn

Một cột = một lớp

nhập mô tả hình ảnh ở đây


Bạn thấy điều đó:

  • trong trường hợp đa nhãn, một mẫu có thể được chỉ định nhiều hơn một lớp.
  • trong trường hợp đa lớp, có tổng cộng hơn 2 lớp.

Là một lưu ý phụ, không có gì ngăn cản bạn gặp vấn đề phân loại đa lớp , ví dụ:

nhập mô tả hình ảnh ở đây


7

Một vấn đề đa lớp có sự phân công các thể hiện cho một trong các tập hợp các lớp hữu hạn, loại trừ lẫn nhau. Như trong ví dụ đã được đưa ra về cua (từ @Dikran): nam-xanh, nữ-xanh, cam-nam, cam-nữ. Mỗi trong số này là độc quyền của những người khác và cùng nhau họ là toàn diện.

Một dạng của vấn đề đa nhãn là chia chúng thành hai nhãn, giới tính và màu sắc; trong đó tình dục có thể là nam hoặc nữ, và màu sắc có thể là màu xanh hoặc màu cam. Nhưng lưu ý rằng đây là trường hợp đặc biệt của vấn đề đa nhãn vì mọi trường hợp sẽ nhận được mọi nhãn (đó là mỗi con cua có cả giới tính và màu sắc).

Các vấn đề đa nhãn cũng bao gồm các trường hợp khác cho phép gán một số lượng nhãn khác nhau cho từng trường hợp. Ví dụ, một bài báo trên một tờ báo hoặc dịch vụ dây có thể được gán cho các danh mục TIN TỨC, CHÍNH TRỊ, THỂ THAO, THUỐC, v.v. Một câu chuyện về một sự kiện thể thao quan trọng sẽ được chuyển nhượng nhãn SPORTS; trong khi một vấn đề khác, liên quan đến những căng thẳng chính trị được tiết lộ bởi một sự kiện thể thao cụ thể, có thể nhận được cả hai nhãn SPORTS và CHÍNH TRỊ. Tôi đang ở đâu, ở Mỹ, kết quả của Superbowl được dán nhãn cả THỂ THAO và TIN TỨC do tác động xã hội của sự kiện.

Lưu ý rằng hình thức ghi nhãn này, với số lượng nhãn thay đổi, có thể được đúc lại thành một hình thức tương tự như ví dụ với cua; ngoại trừ mọi nhãn được coi là LABEL-X hoặc không-LABEL-X. Nhưng không phải tất cả các phương pháp đều yêu cầu việc này.


2

Và một điểm khác biệt nữa nằm ở chỗ vấn đề đa nhãn đòi hỏi mô hình phải tìm hiểu mối tương quan giữa các lớp khác nhau, nhưng trong các vấn đề đa lớp, các lớp khác nhau độc lập với nhau.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.