Những gì @Clayton đăng dường như đúng với tôi, đối với những điều khoản đó và cho "khai thác dữ liệu" là một công cụ của nhà khoa học dữ liệu. Tuy nhiên, tôi chưa thực sự sử dụng thuật ngữ "thu thập dữ liệu" và nó không đồng nghĩa với tôi là "khai thác dữ liệu".
Câu trả lời của riêng tôi cho câu hỏi của bạn: không , các điều khoản không giống nhau. Các định nghĩa có thể lỏng lẻo trong lĩnh vực này, nhưng tôi chưa thấy các thuật ngữ đó được sử dụng thay thế cho nhau. Trong công việc của tôi, đôi khi chúng tôi sử dụng chúng để phân biệt giữa các mục tiêu hoặc phương pháp luận. Đối với chúng tôi, khoa học dữ liệu liên quan nhiều hơn đến việc kiểm tra một giả thuyết và thông thường dữ liệu đã được thu thập chỉ cho mục đích đó. khai thác dữ liệu liên quan nhiều hơn đến việc sàng lọc thông qua dữ liệu hiện có, tìm kiếm cấu trúc và có thể tạo ra các giả thuyết. Khai thác dữ liệu có thể bắt đầu bằng một giả thuyết, nhưng nó thường rất yếu hoặc chung chung và có thể khó giải quyết với sự tự tin. (Đào đủ lâu và bạn sẽ tìm thấy thứ gì đó , mặc dù nó có thể trở thành pyrite.)
Tuy nhiên, chúng tôi cũng đã sử dụng "khoa học dữ liệu" như một thuật ngữ rộng hơn, để bao gồm "khai thác dữ liệu". Chúng tôi cũng nói về "mô hình hóa dữ liệu", mà đối với chúng tôi là tìm kiếm một mô hình cho một hệ thống quan tâm, dựa trên dữ liệu cũng như các kiến thức và mục tiêu khác. Đôi khi điều đó có nghĩa là cố gắng tìm ra toán học giải thích hệ thống thực và đôi khi nó có nghĩa là tìm ra một mô hình dự đoán đủ tốt cho một mục đích.