Mặc dù tôi đồng ý về câu trả lời của ncasas ở hầu hết các điểm (+1), tôi xin được khác nhau về một số:
- Cây quyết định cũng có thể được sử dụng làm mô hình hộp đen. Trên thực tế, tôi muốn nói trong hầu hết các trường hợp, chúng được sử dụng làm mô hình hộp đen. Nếu bạn có 10.000 tính năng và một cây có độ sâu 50, bạn không thể mong đợi một cách hợp lý một con người sẽ hiểu nó.
- Mạng lưới thần kinh có thể được hiểu. Có nhiều kỹ thuật phân tích (xem chương 2.5 của luận án thạc sĩ của tôi cho một số mục đích nhằm cải thiện mô hình). Đặc biệt là phân tích tắc (Hình 2.10), Trực quan hóa bộ lọc (Hình 2.11). Ngoài ra tại sao tôi nên tin tưởng bạn? giấy ( ghi chú của tôi ).
Giải thích dự đoán về mô hình hộp đen bằng phân tích tắc ẩn lạ mắt (từ "Tại sao tôi nên tin tưởng bạn?"):
Tôi muốn chỉ ra The Mythos of Model Interpretability . Nó hình thành một số ý tưởng về khả năng diễn giải một cách súc tích.
Câu hỏi của bạn
Tại sao các mô hình Machine Learning được gọi là hộp đen?
Cách mọi người sử dụng nó : Bởi vì họ không mô hình hóa vấn đề theo cách cho phép con người nói trực tiếp những gì xảy ra cho bất kỳ đầu vào nào.
Suy nghĩ cá nhân
Tôi không nghĩ khái niệm "mô hình hộp đen" này có ý nghĩa nhiều. Ví dụ, nghĩ về dự báo thời tiết. Bạn không thể mong đợi bất kỳ con người nào nói thời tiết nào sẽ được dự đoán nếu anh ta chỉ được cung cấp dữ liệu. Tuy nhiên, hầu hết mọi người sẽ không nói rằng mô hình thời tiết vật lý là mô hình hộp đen. Vậy đâu là sự khác biệt? Có phải chỉ có một mô hình được tạo ra bằng dữ liệu và mô hình kia được tạo ra bằng cách sử dụng những hiểu biết sâu sắc về vật lý?
Khi mọi người nói về các mô hình hộp đen, họ thường nói nó như thể đó là một điều xấu. Nhưng con người là mô hình hộp đen, quá. Sự khác biệt quan trọng mà tôi thấy ở đây là lớp lỗi mà con người mắc phải dễ dự đoán hơn đối với con người. Do đó, đây là một vấn đề đào tạo (ví dụ đối nghịch về phía NN) và vấn đề giáo dục (dạy cho con người cách thức làm việc của NN).
Cách sử dụng thuật ngữ 'mô hình hộp đen' : Cách tiếp cận có ý nghĩa hơn đối với tôi là gọi vấn đề là "vấn đề hộp đen", tương tự như những gì người dùng144410 (+1) viết. Do đó, bất kỳ mô hình nào chỉ xử lý sự cố dưới dạng hộp đen - do đó, một cái gì đó bạn có thể đưa đầu vào vào và lấy đầu ra - là mô hình hộp đen. Các mô hình có cái nhìn sâu sắc (không chỉ giả định!) Về vấn đề không phải là mô hình hộp đen. Phần sâu sắc là khó khăn. Mọi mô hình đều đưa ra các hạn chế đối với chức năng có thể mà nó có thể mô hình hóa (vâng, tôi biết về vấn đề xấp xỉ phổ quát. Miễn là bạn sử dụng NN có kích thước cố định mà nó không áp dụng). Tôi sẽ nói một cái gì đó là một cái nhìn sâu sắc về vấn đề nếu bạn biết điều gì đó về mối quan hệ của đầu vào và đầu ra mà không chọc vào vấn đề (mà không cần nhìn vào dữ liệu).
Điều gì sau đây:
- Mạng nơ-ron có thể không phải là hộp đen (whitebox?)
- Hồi quy logistic có thể là một mô hình hộp đen.
- Đó là nhiều hơn về vấn đề và hiểu biết của bạn về nó, ít hơn về mô hình.