Câu hỏi hay. Trên thực tế có rất nhiều nhầm lẫn về chủ đề này, chủ yếu là vì cả hai đều là công việc khá mới. Nhưng nếu chúng ta tập trung vào ngữ nghĩa, ý nghĩa thực sự của các công việc trở nên rõ ràng.
Trước đó là tốt hơn để so sánh táo với táo, nói về một chủ đề duy nhất, Dữ liệu. Machine Learning và thể loại phụ của nó (Deep Learning, v.v.) chỉ là một khía cạnh của Thế giới dữ liệu, cùng với các lý thuyết thống kê, thu thập dữ liệu (DAQ), xử lý (có thể là học máy không điều khiển), giải thích kết quả, vv
Vì vậy, để giải thích cho tôi, tôi sẽ mở rộng vai trò của Kỹ sư học máy sang vai trò của Kỹ sư dữ liệu.
Khoa học là về thử nghiệm, thử nghiệm và thất bại, xây dựng lý thuyết, hiểu biết hiện tượng học. Kỹ thuật là về công việc dựa trên những gì khoa học đã biết, hoàn thiện nó và mang đến "thế giới thực".
Hãy nghĩ về một proxy: sự khác biệt giữa một nhà khoa học hạt nhân và một kỹ sư hạt nhân là gì?
Nhà khoa học hạt nhân là người biết về khoa học đằng sau nguyên tử, sự tương tác giữa chúng, là người đã viết công thức cho phép lấy năng lượng từ các nguyên tử.
Kỹ sư hạt nhân là anh chàng được giao nhiệm vụ đưa công thức của nhà khoa học, và mang nó đến thế giới thực. Vì vậy, kiến thức về vật lý nguyên tử còn khá hạn chế, nhưng anh ta cũng biết về vật liệu, tòa nhà, kinh tế và bất cứ điều gì hữu ích khác để xây dựng một nhà máy hạt nhân thích hợp.
Quay trở lại thế giới dữ liệu, đây là một ví dụ khác: những người phát triển Mạng thần kinh chuyển đổi (Yann LeCun) là Nhà khoa học dữ liệu, người triển khai mô hình để nhận diện khuôn mặt trong ảnh là Kỹ sư máy học. Anh chàng chịu trách nhiệm cho toàn bộ quá trình, từ việc thu thập dữ liệu đến đăng ký hình ảnh .JPG, là một Kỹ sư dữ liệu.
Vì vậy, về cơ bản, 90% Nhà khoa học dữ liệu ngày nay thực sự là Kỹ sư dữ liệu hoặc Kỹ sư máy học và 90% vị trí được mở khi Nhà khoa học dữ liệu thực sự cần Kỹ sư. Kiểm tra dễ dàng: trong cuộc phỏng vấn, bạn sẽ được hỏi về số lượng mô hình ML bạn đã triển khai trong sản xuất, chứ không phải về bao nhiêu bài viết về các phương pháp mới mà bạn đã xuất bản.
Thay vào đó, khi bạn thấy thông báo về "Kỹ sư máy học", điều đó có nghĩa là các nhà tuyển dụng nhận thức rõ về sự khác biệt và họ thực sự cần ai đó có thể đưa một số mô hình vào sản xuất.
Data scientist
Nghe có vẻ như một sự chỉ định với một chút rõ ràng về công việc thực tế sẽ là gì, trong khimachine learning engineer
cụ thể hơn. Trong trường hợp đầu tiên, công ty của bạn sẽ cung cấp cho bạn một mục tiêu và bạn cần tìm ra cách tiếp cận nào (học máy, xử lý hình ảnh, mạng thần kinh, logic mờ, v.v.) bạn sẽ sử dụng. Trong trường hợp thứ hai, công ty của bạn đã thu hẹp vào cách tiếp cận nào sẽ được sử dụng.