Làm thế nào để xây dựng một ma trận nhầm lẫn cho một phân loại đa lớp?


11

Tôi có một vấn đề với 6 lớp. Vì vậy, tôi xây dựng một trình phân loại đa lớp, như sau: đối với mỗi lớp, tôi có một trình phân loại Hồi quy Logistic, sử dụng One vs. All, có nghĩa là tôi có 6 trình phân loại khác nhau.

Tôi có thể báo cáo một ma trận nhầm lẫn cho từng phân loại của mình. Nhưng, tôi muốn báo cáo một ma trận nhầm lẫn cho TẤT CẢ các phân loại, như tôi đã thấy trong rất nhiều ví dụ ở đây.

Tôi làm nó như thế nào? Tôi có phải thay đổi chiến lược phân loại của mình không, sử dụng thuật toán One vs. One thay vì One vs. All? Bởi vì trên các ma trận nhầm lẫn này, các báo cáo cho biết các kết quả dương tính giả cho mỗi lớp.

Ví dụ về ma trận nhầm lẫn đa lớp

Ma trận nhầm lẫn đa kính

Tôi muốn tìm số lượng các mục phân loại sai. Trong hàng đầu tiên, có 137 ví dụ của lớp 1 được phân loại là lớp 1 và 13 ví dụ của lớp 1 được phân loại là lớp 2 . Làm thế nào để có được số này?


Số lượng các mục được phân loại sai là tổng của tất cả các phần tử trong ma trận trừ đi dấu vết của ma trận ... nhưng tôi không nghĩ đây là ý của bạn.

1
Về mặt cơ học, bạn có được ma trận này bằng cách trước tiên tách riêng bài kiểm tra của bạn theo lớp thực tế của chúng (giả sử Target = 1, Target = 2, v.v.), sau đó áp dụng trình phân loại được đào tạo của bạn cho từng điểm trong mỗi nhóm. Vì vậy, với Target = 1, bạn sẽ điền vào hàng trên cùng của ma trận, dựa trên số lượng thành viên của nhóm này được chỉ định cho mỗi lớp.

Đây chính xác là cách nó nên được thực hiện .... Vì vậy, cơ học như bạn đã nói. Cảm ơn!
Victor Leal

1
không vấn đề gì. Tôi đã đề cập chính thức hơn trong bài viết của mình, nhưng đôi khi nó giúp xem công thức thực tế.

Câu trả lời:


6

Có lẽ, bạn đang sử dụng các trình phân loại này để giúp chọn một lớp cụ thể cho một tập hợp các giá trị tính năng nhất định (như bạn đã nói bạn đang tạo một trình phân loại đa lớp).

Vì vậy, giả sử bạn có lớp, thì ma trận nhầm lẫn của bạn sẽ là ma trận , với trục trái hiển thị lớp thực (như đã biết trong tập kiểm tra) và trục trên cùng hiển thị lớp được gán cho một mục với đó là lớp học thực sự. Mỗi phần tử của ma trận sẽ là số mục có lớp thực sự được phân loại là thuộc lớp .N × N i , j i jNN×Ni,jij

Đây chỉ là một phần mở rộng đơn giản của ma trận nhầm lẫn 2 lớp.


Đúng! Tôi biết về điều đó! Nhưng, làm thế nào để nói sai tích cực? Ý tôi là, có những ví dụ về số lượng các mục được phân loại sai được hiển thị .... và các trình phân loại của tôi chỉ nói "Này, có 60 mục của lớp A và 40 mục thuộc về một lớp khác (tôi chỉ không thể nói đó là mục nào là ...) "
Victor Leal

1
@VictorLeal Tôi không theo dõi, một ma trận nhầm lẫn sẽ cho bạn biết dương tính giả, dương tính thật, phủ định đúng, phủ định sai..có gì thiếu?

1
@VictorLeal xem tại đây: en.wikipedia.org/wiki/Confusion_matrix

Tôi biết thông tin mà chúng ta có trong Ma trận nhầm lẫn. Có lẽ một hình ảnh có thể thể hiện tốt hơn những gì tôi đang nói về: Multiclass Multiclass
Victor Leal

@VictorLeal Trông giống như một ma trận nhầm lẫn bình thường đối với tôi ... LHS hiển thị lớp thực tế trên cùng hiển thị lớp được chỉ định ... tôi có thiếu thứ gì không? Ngoài ra, bạn nên thêm hình ảnh này vào bài đăng của mình..tôi sẽ hữu ích

11

Mặc dù đã có một số câu trả lời trên diễn đàn này, tôi nghĩ rằng tôi sẽ đưa ra các phương trình rõ ràng để làm cho nó rõ ràng hơn:

Giả sử bạn có ma trận nhầm lẫn nhiều lớp có dạng,

C=ActualClassifedc11...c1ncn1cnn

Các yếu tố nhầm lẫn cho mỗi lớp được đưa ra bởi:

tpi=cii

fpi=l=1nclitpi

fni=l=1nciltpi

tni=l=1nk=1nclktpifpifni


l và L là gì?
cô gái

1
Ngoài ra, tp, tn, fp, fn là gì cho tất cả các lớp học cùng nhau
girl101

tp = true dương, fp = false dương, fn = false âm, tn = true âm. Tôi cho rằng chỉ số i là tham chiếu cho mỗi lớp.
albert

1

Sử dụng ma trận được đính kèm trong câu hỏi và coi các giá trị trong trục tung là lớp thực tế và các giá trị trong trục ngang dự đoán. Sau đó, cho lớp 1:

  • Đúng tích cực = 137-> mẫu của lớp 1, được phân loại là lớp 1
  • Sai dương tính = 6-> (1 + 2 + 4) mẫu của lớp 2, 3 và 4, nhưng được phân loại là lớp 1
  • 18Mẫu âm tính = -> (13 + 3 + 1 + 1) của lớp 1, nhưng được phân loại là lớp 2, 3, 6 và 7
  • Ture Phủ định = 581-> (55 + 1 + 6 ... + 2 + 26) Tổng của tất cả các giá trị trong ma trận trừ các giá trị trong cột 1 và hàng 1
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.