Tôi đã trải qua so sánh các ngành học phân tích và quan điểm về học máy này , nhưng tôi không tìm thấy bất kỳ câu trả lời nào sau đây:
- Khoa học dữ liệu liên quan đến Machine learning như thế nào?
- Làm thế nào nó không liên quan đến Machine Learning?
Tôi đã trải qua so sánh các ngành học phân tích và quan điểm về học máy này , nhưng tôi không tìm thấy bất kỳ câu trả lời nào sau đây:
Câu trả lời:
Khoa học dữ liệu là khái niệm rộng hơn nhiều so với học máy. Nó bắt đầu từ trực quan hóa dữ liệu đơn giản và thống kê mô tả để có được những hiểu biết, thao tác như làm sạch để chuẩn bị dữ liệu. Trước khi bạn có thể sử dụng một số thuật toán ML.
Về cơ bản các ngăn xếp khổng lồ như bigdata, trực quan hóa và tiền xử lý dữ liệu nằm ngoài phạm vi học máy. Và chúng đều là những phần không thể thiếu của "Khoa học dữ liệu".
Hình ảnh độ phân giải lớn: https://whatsthebigdata.files.wordpress.com/2013/07/datascientistmap.png
Machine Learning cố gắng tạo ra các hệ thống có thể học từ dữ liệu. Do đó, nó có thể được sử dụng trong nhiều cài đặt khác nhau, ví dụ như để làm cho robot học cách đi bộ hoặc huấn luyện các tác nhân ảo để chơi trò chơi video .
Khoa học dữ liệu liên quan đến việc khai thác kiến thức từ dữ liệu. Để làm như vậy, nó sử dụng một loạt các kỹ thuật khác nhau từ các ngành khác nhau. Học máy bao gồm một số kỹ thuật có thể rất hữu ích cho một nhà khoa học dữ liệu như học sâu, cây quyết định và các thuật toán phân cụm khác nhau. Tuy nhiên, học máy có nhiều thứ hơn là sử dụng Khoa học dữ liệu và Khoa học dữ liệu không chỉ dựa vào Học máy.
Khoa học dữ liệu rộng hơn nhiều. Đó là một thuật ngữ dễ hiểu mà ngay bây giờ không thực sự có một định nghĩa rất rõ ràng. Nhưng khoa học dữ liệu bao gồm tất cả các kỹ năng và kỹ thuật cần thiết để hiểu được dữ liệu có tốc độ cao (nó sẽ đến với bạn một cách nhanh chóng), âm lượng (có rất nhiều), hoặc biến đổi (nó lộn xộn, như xử lý ngôn ngữ tự nhiên). Điều này có nghĩa là nó chắc chắn bao gồm học máy và AI, nhưng đó cũng là về các công cụ mà người ta có thể sử dụng trong tình huống thực tế như SQL, Hadoop hoặc Spark (và thông tin liên quan như kiến thức về lập trình song song). Ngoài ra, khoa học dữ liệu có thể bao gồm hoặc không bao gồm khía cạnh giao tiếp, chẳng hạn như tạo biểu đồ tốt và sử dụng Excel.
Về cơ bản, Khoa học dữ liệu là ML +.
Khoa học dữ liệu, như những người khác đã lưu ý, một thuật ngữ rộng hơn nhiều so với học máy. Áp dụng các kỹ thuật học máy là một khía cạnh của khoa học dữ liệu. Khoa học dữ liệu, nói chung, là khoa học thu thập kiến thức từ dữ liệu. Thuật ngữ này được đặt ra từ năm 1960 và tiếp tục phát triển để mô tả dòng chảy và tác động lẫn nhau của định nghĩa vấn đề, thu thập dữ liệu, chuyển đổi dữ liệu, mô hình hóa / phân tích dữ liệu và ra quyết định. Vì vậy, để trả lời câu hỏi của bạn cụ thể: