Gần đây tôi đã xuất bản một bộ dữ liệu ( liên kết ) với 369 lớp. Tôi đã thực hiện một vài thí nghiệm trên chúng để có cảm giác về nhiệm vụ phân loại khó khăn như thế nào. Thông thường, tôi thích nó nếu có ma trận nhầm lẫn để xem loại lỗi được thực hiện. Tuy nhiên, một ma trận là không thực tế.
Có cách nào để cung cấp thông tin quan trọng của ma trận nhầm lẫn lớn? Ví dụ, thường có rất nhiều số 0 không thú vị lắm. Có thể sắp xếp các lớp sao cho hầu hết các mục nhập khác không nằm xung quanh đường chéo để cho phép hiển thị nhiều ma trận là một phần của ma trận nhầm lẫn hoàn chỉnh?
Dưới đây là một ví dụ cho một ma trận nhầm lẫn lớn .
Ví dụ trong tự nhiên
Hình 6 của EMNIST trông rất đẹp:
Thật dễ dàng để xem nơi có nhiều trường hợp. Tuy nhiên, đó chỉ là lớp. Nếu toàn bộ trang được sử dụng thay vì chỉ một cột thì có thể có thể gấp 3 lần, nhưng đó vẫn chỉ là 3 ⋅ 26 = 78 lớp. Thậm chí không gần với 369 lớp HASY hoặc 1000 ImageNet.
Xem thêm
Câu hỏi tương tự của tôi trên CS.stackexchange