Làm thế nào bạn sẽ mô tả sự đánh đổi giữa khả năng diễn giải mô hình và sức mạnh dự đoán mô hình theo thuật ngữ của giáo dân?


7

Tôi biết nó phụ thuộc vào dữ liệu và câu hỏi được hỏi nhưng hãy tưởng tượng một kịch bản mà đối với một tập dữ liệu đã cho, bạn có thể sử dụng mô hình phi tuyến khá phức tạp (khó diễn giải) có thể cho bạn khả năng dự đoán tốt hơn có lẽ vì mô hình có thể thấy sự phi tuyến tính trong dữ liệu, hoặc có một mô hình đơn giản (có thể là mô hình tuyến tính hoặc một cái gì đó) với sức mạnh dự đoán ít hơn nhưng dễ giải thích hơn. Dưới đây là một bài viết rất hay thảo luận về ý tưởng về cách diễn giải các mô hình học máy.

Các ngành công nghiệp, trong khi rất thận trọng, đang dần trở nên quan tâm hơn đến việc áp dụng các mô hình phức tạp hơn! Họ vẫn muốn biết rõ sự đánh đổi? Một nhà khoa học dữ liệu có lẽ là người ngồi giữa nhóm dữ liệu và những người ra quyết định và thường cần có thể giải thích những điều này theo thuật ngữ của giáo dân.

Tôi đang cố gắng động não ở đây để xem bạn sẽ nghĩ ra sự tương tự nào để mô tả sự đánh đổi đó với một người không có kỹ thuật?


1
Một cách tiếp cận mới là tách rời sự phức tạp của mô hình khỏi khả năng diễn giải của nó bằng cách áp dụng một mô hình có thể hiểu được; xem github.com/slundberg/shap
Emre

Đó là siêu thú vị; SHAP trông rất tuyệt và hữu ích, cảm ơn vì đã chia sẻ @Emre.
TwinPenguins

Câu trả lời:


1

Câu hỏi thú vị. Tôi nghĩ rằng bạn có thể minh họa điều này bằng cách suy nghĩ về các trường hợp sử dụng khác nhau. Một ví dụ tôi đã nghe nói rằng tôi thích là xung quanh các quyết định cho vay đối với các đơn xin vay tiền. Đó là một thuật toán, nhưng vì quy định, nó không thể là "hộp đen". Quyết định phải, một cách hiệu quả, có thể giải thích được vì ngân hàng phải cung cấp cho bạn một lý do từ chối cho khoản vay. Vì vậy, chắc chắn có nhiều thuật toán tốt hơn cho các khoản vay có thể mang lại kết quả nhị phân, nhưng bạn có muốn một ngân hàng chỉ cho bạn biết có hay không?


1

Một câu hỏi khác bạn có thể tự hỏi mình là liệu bạn có mục tiêu kinh doanh để hiểu hệ thống theo cách cung cấp cho bạn thông tin về đầu vào và mối quan hệ của chúng hay không và những thay đổi đối với những đầu vào đó ảnh hưởng đến kết quả của bạn (dự đoán).

Một ví dụ gần đây về một vấn đề mà tôi đã giải quyết trong trường hợp này là dự đoán số lượng khách hàng tiềm năng thị trường theo tháng (tuần, ngày) sử dụng chi tiêu theo kênh (TV, radio, kỹ thuật số). Ở đây, mục tiêu không chỉ là dự đoán có bao nhiêu khách hàng tiềm năng sẽ được tạo ra mà còn có một khung để sử dụng để tối ưu hóa việc tạo khách hàng tiềm năng xung quanh phân phối chi tiêu (nghĩa là phân phối chi tiêu hiệu quả nhất trên TV, đài phát thanh và kỹ thuật số để tạo ra số lượng khách hàng tiềm năng lớn nhất). Do yêu cầu kinh doanh này, mạng lưới thần kinh hoặc SVM sẽ không đáp ứng được mục tiêu của chúng tôi bởi vì, trong khi họ đã đưa ra dự đoán về việc tạo ra khách hàng tiềm năng, họ sẽ không cung cấp sự hiểu biết về đầu vào (chi tiêu theo kênh).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.