XGboost - Lựa chọn theo mô hình


10

tôi đang sử dụng XGboost để dự đoán biến mục tiêu 2 lớp trên các yêu cầu bảo hiểm. Tôi có một mô hình (đào tạo với xác nhận chéo, điều chỉnh siêu tham số, v.v.) tôi chạy trên một tập dữ liệu khác.

Câu hỏi của tôi là :

có cách nào để biết lý do tại sao một yêu cầu nhất định đã bị ảnh hưởng đến một lớp tức là các tính năng giải thích sự lựa chọn của mô hình không?

Mục đích là để có thể biện minh cho sự lựa chọn của máy cho bên thứ ba.

Cảm ơn câu trả lời của bạn.

Câu trả lời:


7

Tôi đề nghị bạn đi cho Shap . Nó sử dụng các giá trị Shapley (khái niệm mượn từ Lý thuyết trò chơi) để mô tả hành vi mô hình và với điều đó có thể giải thích một dự đoán duy nhất.

Giao diện đồ họa của nó sử dụng Force Plots, giống như giao diện mà bạn nhìn thấy bên dưới. nhập mô tả hình ảnh ở đây

Thanh màu đỏ được xây dựng bởi các tính năng dẫn dự đoán đến các giá trị dương và màu xanh lam bởi các tính năng khác.

Trong trường hợp của bạn (một bộ phân loại), số in đậm sẽ là số ngay trước hàm sigmoid sẽ giới hạn giá trị đầu ra giữa 0 và một (một lớp này hoặc lớp kia). Vì vậy, đừng sợ nếu trong một số trường hợp, nó sẽ lớn hơn một hoặc âm.

Kích thước của các phân đoạn thể hiện số lượng tính năng đó đóng góp cho dự đoán và trong các phân đoạn bạn thấy tên của tính năng (ví dụ: LSTAT) và giá trị thực của nó (ví dụ: 4,98). Vì vậy, trong trường hợp này, LSTAT là tính năng trung bình dẫn dự đoán cho phần tử của bộ dữ liệu đến giá trị 24,41 (số được in đậm).

Thưởng thức!


9

Bạn có thể sử dụng thư viện ELI5 để giải thích các đóng góp tính năng cho các dự đoán riêng lẻ cho các mô hình XGBoost.

Xem Giải thích Dự đoán trong các tài liệu, được sao chép dưới đây:

Để hiểu rõ hơn về cách thức phân loại của chúng tôi hoạt động, hãy xem xét các dự đoán riêng lẻ với eli5.show_prediction():

from eli5 import show_prediction
show_prediction(clf, valid_xs[1], vec=vec, show_feature_values=True)

nhập mô tả hình ảnh ở đây


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.