Tôi nghĩ rằng trình phân loại LDA nhiều lớp luôn luôn (tốt, trong hầu hết các nhiệm vụ thực tế) thực hiện LDA 2 lớp. Và tôi sẽ cố gắng để mô tả tại sao.
Hãy xem tập dữ liệu mẫu:
Bạn có ba lớp học ở đây. Và giả sử bạn muốn xây dựng trình phân loại một đấu với LDA cho lớp màu xanh.
Giá trị trung bình ước tính cho lớp "màu xanh" là 0, nhưng giá trị trung bình ước tính của lớp "khác" cũng bằng không. Và hiệp phương sai giống với định nghĩa của LDA. Điều đó có nghĩa là LDA sẽ phản hồi với nhãn có nhiều yếu tố hơn. Và nó sẽ không bao giờ trở lại lớp "màu xanh" cả!
Đối với LDA nhiều lớp, nó sẽ quản lý để tìm đúng các lớp một cách hoàn hảo.
Bối cảnh về điều này là hỗn hợp Gaussian không phải là Gaussian nữa trong hầu hết các trường hợp. Vì vậy, giả định này của LDA thất bại. Và tôi phải nói rằng thật khó để đưa ra một ví dụ về một tập dữ liệu trong đó mọi lớp là Gaussian và chúng vẫn là Gaussian sau khi chúng ta tham gia chúng.
Đó là lý do tại sao tôi rất khuyến khích sử dụng LDA nhiều lớp. Hy vọng nó sẽ giúp!