Khoa học dữ liệu liên quan đến Machine learning như thế nào?


7

Tôi đã trải qua so sánh các ngành học phân tíchquan điểm về học máy này , nhưng tôi không tìm thấy bất kỳ câu trả lời nào sau đây:

  1. Khoa học dữ liệu liên quan đến Machine learning như thế nào?
  2. Làm thế nào nó không liên quan đến Machine Learning?

Có lẽ câu hỏi này nên tồn tại như wiki cộng đồng.
Shagun Sodhani

Câu trả lời:


6

Khoa học dữ liệu là khái niệm rộng hơn nhiều so với học máy. Nó bắt đầu từ trực quan hóa dữ liệu đơn giản và thống kê mô tả để có được những hiểu biết, thao tác như làm sạch để chuẩn bị dữ liệu. Trước khi bạn có thể sử dụng một số thuật toán ML.

Về cơ bản các ngăn xếp khổng lồ như bigdata, trực quan hóa và tiền xử lý dữ liệu nằm ngoài phạm vi học máy. Và chúng đều là những phần không thể thiếu của "Khoa học dữ liệu".

Hình ảnh độ phân giải lớn: https://whatsthebigdata.files.wordpress.com/2013/07/datascientistmap.png


hình ảnh đó được tìm thấy ở kích thước ban đầu ở đâu?
Walter Tross


4

Machine Learning cố gắng tạo ra các hệ thống có thể học từ dữ liệu. Do đó, nó có thể được sử dụng trong nhiều cài đặt khác nhau, ví dụ như để làm cho robot học cách đi bộ hoặc huấn luyện các tác nhân ảo để chơi trò chơi video .

Khoa học dữ liệu liên quan đến việc khai thác kiến ​​thức từ dữ liệu. Để làm như vậy, nó sử dụng một loạt các kỹ thuật khác nhau từ các ngành khác nhau. Học máy bao gồm một số kỹ thuật có thể rất hữu ích cho một nhà khoa học dữ liệu như học sâu, cây quyết định và các thuật toán phân cụm khác nhau. Tuy nhiên, học máy có nhiều thứ hơn là sử dụng Khoa học dữ liệu và Khoa học dữ liệu không chỉ dựa vào Học máy.


3

Khoa học dữ liệu rộng hơn nhiều. Đó là một thuật ngữ dễ hiểu mà ngay bây giờ không thực sự có một định nghĩa rất rõ ràng. Nhưng khoa học dữ liệu bao gồm tất cả các kỹ năng và kỹ thuật cần thiết để hiểu được dữ liệu có tốc độ cao (nó sẽ đến với bạn một cách nhanh chóng), âm lượng (có rất nhiều), hoặc biến đổi (nó lộn xộn, như xử lý ngôn ngữ tự nhiên). Điều này có nghĩa là nó chắc chắn bao gồm học máy và AI, nhưng đó cũng là về các công cụ mà người ta có thể sử dụng trong tình huống thực tế như SQL, Hadoop hoặc Spark (và thông tin liên quan như kiến ​​thức về lập trình song song). Ngoài ra, khoa học dữ liệu có thể bao gồm hoặc không bao gồm khía cạnh giao tiếp, chẳng hạn như tạo biểu đồ tốt và sử dụng Excel.

Về cơ bản, Khoa học dữ liệu là ML +.


3

Khoa học dữ liệu, như những người khác đã lưu ý, một thuật ngữ rộng hơn nhiều so với học máy. Áp dụng các kỹ thuật học máy là một khía cạnh của khoa học dữ liệu. Khoa học dữ liệu, nói chung, là khoa học thu thập kiến ​​thức từ dữ liệu. Thuật ngữ này được đặt ra từ năm 1960 và tiếp tục phát triển để mô tả dòng chảy và tác động lẫn nhau của định nghĩa vấn đề, thu thập dữ liệu, chuyển đổi dữ liệu, mô hình hóa / phân tích dữ liệu và ra quyết định. Vì vậy, để trả lời câu hỏi của bạn cụ thể:

  1. Học máy hỗ trợ khoa học dữ liệu bằng cách cung cấp một bộ thuật toán để mô hình hóa / phân tích dữ liệu (thông qua đào tạo thuật toán học máy), ra quyết định (thông qua phát trực tuyến, học trực tuyến, kiểm tra thời gian thực, tất cả đều là chủ đề của học máy) và thậm chí chuẩn bị dữ liệu (thuật toán học máy tự động phát hiện sự bất thường trong dữ liệu).
  2. Khoa học dữ liệu kết hợp một loạt các ý tưởng / thuật toán được rút ra từ học máy để tạo ra một giải pháp và làm như vậy mượn rất nhiều ý tưởng từ thống kê truyền thống, chuyên môn về miền và toán học cơ bản. Theo cách này, khoa học dữ liệu là quá trình giải quyết trường hợp sử dụng, cung cấp một giải pháp trái ngược với học máy là một răng cưa quan trọng trong giải pháp đó.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.