Tôi đang đọc về hai kỹ thuật diễn giải mô hình bài hoc phổ biến: LIME và SHAP
Tôi gặp khó khăn trong việc hiểu sự khác biệt chính trong hai kỹ thuật này.
Để trích dẫn Scott Lundberg , bộ não đằng sau SHAP:
Các giá trị SHAP đi kèm với các lợi thế ước tính cục bộ của hộp đen của LIME, nhưng cũng đi kèm với các đảm bảo về mặt lý thuyết về tính nhất quán và độ chính xác cục bộ từ lý thuyết trò chơi (các thuộc tính từ các phương pháp khác mà chúng tôi thống nhất)
Tôi gặp một số khó khăn trong việc hiểu "điều này đảm bảo về mặt lý thuyết về tính nhất quán và độ chính xác cục bộ từ lý thuyết trò chơi ". Vì SHAP được phát triển sau LIME, tôi cho rằng nó sẽ lấp đầy một số khoảng trống mà LIME không giải quyết được. Đó là những gì?
Cuốn sách của Christoph Molnar trong một chương về Dự toán Shapley nêu rõ:
Sự khác biệt giữa dự đoán và dự đoán trung bình được phân phối khá công bằng giữa các giá trị tính năng của thể hiện - thuộc tính hiệu quả của shapley. Thuộc tính này đặt giá trị Shapley ngoài các phương thức khác như LIME. LIME không đảm bảo phân phối hoàn hảo các hiệu ứng. Nó có thể làm cho giá trị Shapley là phương pháp duy nhất để đưa ra lời giải thích đầy đủ
Đọc điều này, tôi có cảm giác rằng SHAP không phải là một địa phương mà là một lời giải thích rõ ràng về điểm dữ liệu. Tôi có thể sai ở đây và cần một số hiểu biết sâu sắc về ý nghĩa của trích dẫn trên. Để tóm tắt câu hỏi của tôi: LIME tạo ra các giải thích địa phương. Giải thích của SHAP khác với LIME như thế nào?