Hiệu chỉnh bộ phân loại tăng cường đa lớp


19

Tôi đã đọc bài viết của Alexandru Niculescu-Mizil và Rich Caruana " Lấy xác suất hiệu chuẩn từ việc tăng cường " và thảo luận trong chủ đề này . Tuy nhiên, tôi vẫn gặp khó khăn trong việc hiểu và triển khai quy mô logistic hoặc Platt để hiệu chỉnh đầu ra của phân loại tăng cường đa lớp của tôi (tăng nhẹ với các gốc quyết định).

Tôi hơi quen thuộc với các mô hình tuyến tính tổng quát và tôi nghĩ rằng tôi hiểu cách các phương thức hiệu chuẩn của logistic và Platt hoạt động trong trường hợp nhị phân, nhưng tôi không chắc chắn tôi biết cách mở rộng phương thức được mô tả trong bài báo sang trường hợp đa lớp.

Trình phân loại tôi đang sử dụng đầu ra như sau:

  • = Số phiếu mà bộ phân loại bỏ ra cho lớp j cho mẫu i đang được phân loạifTôijjTôi
  • = Lớp dự kiếnyTôi

Tại thời điểm này tôi có các câu hỏi sau:

Q1: Tôi có cần sử dụng logit đa phương để ước tính xác suất không? hoặc tôi vẫn có thể làm điều này với hồi quy logistic (ví dụ: theo kiểu 1-vs-all )?

Câu 2: Làm thế nào tôi nên xác định các biến mục tiêu trung gian (ví dụ như trong tỷ lệ của Platt) cho trường hợp nhiều lớp?

Câu 3: Tôi hiểu điều này có thể có nhiều điều để hỏi, nhưng liệu có ai sẵn sàng phác thảo mã giả cho vấn đề này không? (ở mức độ thực tế hơn, tôi quan tâm đến một giải pháp trong Matlab).


1
câu hỏi tuyệt vời. Tôi cũng đã tự hỏi về cách xây dựng hiệu chuẩn ngay cả khi bạn sử dụng 1 so với loại sơ đồ còn lại. Nếu bạn tạo các mô hình k sử dụng 1 so với phần còn lại (và có các lớp k), bạn có phải / nên bình thường hóa chúng bằng cách nào đó để chúng tổng hợp thành 1 (ví dụ: chia mỗi xác suất hiệu chỉnh cho tổng của tất cả k)?
B_Miner

Câu trả lời:


9

Đây là một chủ đề quan tâm thực tế đối với tôi vì vậy tôi đã làm một nghiên cứu nhỏ. Dưới đây là hai bài báo của một tác giả thường được liệt kê như một tài liệu tham khảo trong những vấn đề này.

  1. Chuyển đổi điểm số phân loại thành ước tính xác suất đa lớp chính xác
  2. Giảm đa giác thành nhị phân bằng cách ước tính xác suất ghép

Ý chính của kỹ thuật được ủng hộ ở đây là giảm vấn đề đa giác thành nhị phân (ví dụ: so với phần còn lại, AKA so với tất cả), sử dụng một kỹ thuật như Platt (tốt nhất là sử dụng bộ kiểm tra) để xác định điểm số / xác suất nhị phân và sau đó kết hợp những thứ này bằng cách sử dụng một kỹ thuật như được thảo luận trong các bài báo (một là một phần mở rộng của một quá trình "khớp nối" của Hastie et al). Trong liên kết đầu tiên, các kết quả tốt nhất đã được tìm thấy bằng cách đơn giản hóa các xác suất nhị phân để chúng tổng hợp thành 1.

Tôi rất thích nghe lời khuyên khác và nếu bất kỳ trong số các tecnhiqes này đã được cấy vào R.


Liên kết được đề cập trong câu trả lời đã lỗi thời. Các liên kết mới nhất là: citeseerx.ist.psu.edu/viewdoc/, citeseerx.ist.psu.edu/viewdoc/ trộm
Chandra


Báo lại câu trả lời này. Điều này làm tôi bối rối một thời gian nhưng bài báo của Zadrozny và Elkan tỏ ra hữu ích.
songololo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.