Tôi đã đọc bài viết của Alexandru Niculescu-Mizil và Rich Caruana " Lấy xác suất hiệu chuẩn từ việc tăng cường " và thảo luận trong chủ đề này . Tuy nhiên, tôi vẫn gặp khó khăn trong việc hiểu và triển khai quy mô logistic hoặc Platt để hiệu chỉnh đầu ra của phân loại tăng cường đa lớp của tôi (tăng nhẹ với các gốc quyết định).
Tôi hơi quen thuộc với các mô hình tuyến tính tổng quát và tôi nghĩ rằng tôi hiểu cách các phương thức hiệu chuẩn của logistic và Platt hoạt động trong trường hợp nhị phân, nhưng tôi không chắc chắn tôi biết cách mở rộng phương thức được mô tả trong bài báo sang trường hợp đa lớp.
Trình phân loại tôi đang sử dụng đầu ra như sau:
- = Số phiếu mà bộ phân loại bỏ ra cho lớp j cho mẫu i đang được phân loại
- = Lớp dự kiến
Tại thời điểm này tôi có các câu hỏi sau:
Q1: Tôi có cần sử dụng logit đa phương để ước tính xác suất không? hoặc tôi vẫn có thể làm điều này với hồi quy logistic (ví dụ: theo kiểu 1-vs-all )?
Câu 2: Làm thế nào tôi nên xác định các biến mục tiêu trung gian (ví dụ như trong tỷ lệ của Platt) cho trường hợp nhiều lớp?
Câu 3: Tôi hiểu điều này có thể có nhiều điều để hỏi, nhưng liệu có ai sẵn sàng phác thảo mã giả cho vấn đề này không? (ở mức độ thực tế hơn, tôi quan tâm đến một giải pháp trong Matlab).