Trong một câu
Mô hình dự đoán là tất cả về "những gì có khả năng xảy ra?", Trong khi mô hình giải thích là tất cả về "chúng ta có thể làm gì về nó?"
Trong nhiều câu
Tôi nghĩ rằng sự khác biệt chính là những gì được dự định sẽ được thực hiện với phân tích. Tôi sẽ đề nghị giải thích là quan trọng hơn nhiều để can thiệp hơn dự đoán. Nếu bạn muốn làm một cái gì đó để thay đổi một kết quả, thì tốt nhất bạn nên tìm cách giải thích tại sao nó lại như vậy. Mô hình giải thích, nếu được thực hiện tốt, sẽ cho bạn biết cách can thiệp (nên điều chỉnh đầu vào nào). Tuy nhiên, nếu bạn chỉ đơn giản muốn hiểu tương lai sẽ như thế nào, mà không có bất kỳ ý định (hoặc khả năng) nào để can thiệp, thì mô hình dự đoán có nhiều khả năng là phù hợp.
Như một ví dụ cực kỳ lỏng lẻo, sử dụng "dữ liệu ung thư".
Mô hình dự đoán sử dụng "dữ liệu ung thư" sẽ phù hợp (hoặc ít nhất là hữu ích) nếu bạn tài trợ cho các phường ung thư của các bệnh viện khác nhau. Bạn không thực sự cần phải giải thích lý do tại sao mọi người bị ung thư, thay vào đó bạn chỉ cần một ước tính chính xác về số lượng dịch vụ sẽ được yêu cầu. Mô hình giải thích có lẽ sẽ không giúp được nhiều ở đây. Ví dụ, việc biết rằng hút thuốc dẫn đến nguy cơ mắc bệnh ung thư cao hơn không tự nó cho bạn biết nên cấp thêm tiền cho phường A hay phường B.
Mô hình giải thích về "dữ liệu ung thư" sẽ phù hợp nếu bạn muốn giảm tỷ lệ ung thư quốc gia - mô hình dự đoán sẽ khá lỗi thời ở đây. Khả năng dự đoán chính xác tỷ lệ ung thư hầu như không thể giúp bạn quyết định làm thế nào để giảm nó. Tuy nhiên, biết rằng hút thuốc dẫn đến nguy cơ mắc bệnh ung thư cao hơn là thông tin có giá trị - bởi vì nếu bạn giảm tỷ lệ hút thuốc (ví dụ như làm thuốc lá đắt hơn), điều này dẫn đến nhiều người có ít rủi ro hơn, điều này (hy vọng) sẽ dẫn đến giảm ung thư giá.
Nhìn vào vấn đề theo cách này, tôi sẽ nghĩ rằng mô hình giải thích chủ yếu sẽ tập trung vào các biến đang kiểm soát người dùng, trực tiếp hoặc gián tiếp. Có thể cần phải thu thập các biến khác, nhưng nếu bạn không thể thay đổi bất kỳ biến nào trong phân tích, thì tôi nghi ngờ rằng mô hình giải thích sẽ hữu ích, ngoại trừ có thể mang lại cho bạn mong muốn giành quyền kiểm soát hoặc ảnh hưởng đến các biến đó đó là quan trọng Mô hình dự đoán, thô sơ, chỉ tìm kiếm sự liên kết giữa các biến, cho dù người dùng có kiểm soát hay không. Bạn chỉ cần biết đầu vào / tính năng / biến độc lập / vv .. để đưa ra dự đoán, nhưng bạn cần có thể sửa đổi hoặc tác động đến đầu vào / tính năng / biến độc lập / vv .. để can thiệp và thay đổi kết quả .