Có tài liệu nào liệt kê các đặc điểm của thuật toán cho phép chúng có thể giải thích được không?
Tài liệu duy nhất tôi biết là bài báo gần đây của Ribero, Singh và Guestrin. Đầu tiên họ xác định khả năng giải thích của một dự đoán duy nhất:
Bằng cách giải thích một dự đoán, chúng tôi có nghĩa là trình bày các tạo tác văn bản hoặc hình ảnh cung cấp sự hiểu biết định tính về mối quan hệ giữa các thành phần của ví dụ (ví dụ như các từ trong văn bản, các bản vá trong hình ảnh) và dự đoán của mô hình.
Các tác giả giải thích thêm về ý nghĩa của điều này đối với các ví dụ cụ thể hơn, và sau đó sử dụng khái niệm này để xác định khả năng giải thích của một mô hình. Mục tiêu của họ là cố gắng và có thể nói thêm khả năng giải thích một cách nhân tạo cho các mô hình nội bộ khác, thay vì so sánh khả năng giải thích của các phương thức hiện có. Bài báo có thể hữu ích dù sao đi nữa, vì cố gắng đưa ra một thuật ngữ chính xác hơn xung quanh khái niệm "giải thích".
Có những mô hình học máy thường được chấp nhận là đại diện cho một sự đánh đổi tốt giữa hai người không?
Tôi đồng ý với @Winter rằng hồi quy mạng đàn hồi (không chỉ logistic) có thể được xem là một ví dụ cho một sự thỏa hiệp tốt giữa độ chính xác dự đoán và khả năng giải thích.
Đối với một loại miền ứng dụng khác (chuỗi thời gian), một lớp phương thức khác cũng cung cấp một sự thỏa hiệp tốt: Mô hình chuỗi thời gian cấu trúc Bayesian. Nó kế thừa khả năng giải thích từ mô hình chuỗi thời gian cấu trúc cổ điển và một số tính linh hoạt từ phương pháp Bayes. Tương tự như hồi quy logistic, khả năng giải thích được trợ giúp bởi các phương trình hồi quy được sử dụng cho mô hình. Xem bài viết này cho một ứng dụng tốt đẹp trong tiếp thị và tham khảo thêm.
Liên quan đến bối cảnh Bayes vừa được đề cập, bạn cũng có thể muốn xem xét các mô hình đồ họa xác suất. Khả năng giải thích của họ không dựa vào các phương trình hồi quy, mà dựa trên các cách mô hình hóa đồ họa; xem "Mô hình đồ họa xác suất: Nguyên tắc và kỹ thuật" của Koller và Friedman để biết tổng quan tuyệt vời.
Tôi không chắc liệu chúng ta có thể đề cập đến các phương pháp Bayes ở trên như là một "sự đánh đổi tốt thường được chấp nhận" hay không. Họ có thể không đủ nổi tiếng về điều đó, đặc biệt là so với ví dụ lưới đàn hồi.