Thật khó để đưa ra một câu trả lời rất hay cho một câu hỏi rộng như vậy.
Khả năng diễn giải mô hình là một chủ đề lớn và thường phụ thuộc vào mô hình. Các mô hình đơn giản hơn, chẳng hạn như hồi quy logistic, dễ diễn giải hơn các mạng thần kinh. Thật dễ dàng để nói những điều như "nếu tôi có thể tăng tính năngXTôi bằng 1, sau đó tỷ lệ cược của y xảy ra sẽ tăng lên bởi βTôi".
Tương tự như vậy, các cây quyết định riêng lẻ dễ giải thích hơn các khu rừng ngẫu nhiên. Tuy nhiên, một số người cố gắng diễn giải các khu rừng ngẫu nhiên bằng cách tính "tầm quan trọng của tính năng", có thể được tính toán theo nhiều cách, một trong số đó là số lần phân tách bao gồm tính năng liên quan đến số lượng mẫu mà nó phân tách.
Bạn muốn một cách để coi mô hình của bạn như một hộp đen và có thể diễn giải bất kỳ mô hình nào?
Tôi có thể nghĩ về hai cách:
- Thao tác với đầu vào của bạn và xem điều gì xảy ra với thông số, sử dụng mẫu của bạn
Một cách điển hình là thay đổi đầu vào và xem tác động đến hiệu suất của mô hình. Trong hình ảnh, bạn có thể bôi đen các phần của hình ảnh và xem phần nào đóng góp nhiều nhất cho độ chính xác. Điều này được sử dụng rộng rãi cho các mạng thần kinh tích chập, rất khó để giải thích khác.
Đối với các biến số, bạn có thể loại bỏ hoặc thêm một số nhiễu cho từng tính năng và xem tác động của tính năng riêng lẻ đó đến kết quả.
Tôi đã thấy những loại điều được sử dụng rộng rãi.
- Đào tạo có và không có tính năng
Tương tự như phần trước, ngoại trừ bạn luyện tập có và không có tính năng này, và xem tác động của nó đến độ chính xác của mô hình.
Điều này có thêm lợi ích mà bạn không phải suy nghĩ về các siêu âm như mức độ nhiễu bạn sẽ thêm vào mỗi tính năng như cách tiếp cận trước đó. Hơn nữa, bạn có thể hiểu rõ hơn về tác động của một số tính năng trong đầu ra bằng cách thử có và không có các tính năng đó.
Tôi chưa thấy cách tiếp cận này được sử dụng, nhưng rõ ràng nó cũng đang được sử dụng, như một người khác trả lời.
Dù sao, tôi sẽ tránh được những vụ hack như vậy. Hầu hết các mô hình có thể được thực hiện bằng cách nào đó có thể giải thích. Tôi đã thấy mọi người thậm chí làm cho các mạng thần kinh tái phát có thể hiểu được. Và, nếu khả năng diễn giải là một mối quan tâm, chỉ cần sử dụng một mô hình đơn giản hơn để dễ giải thích và giải thích.