Kính gửi cộng đồng Machine Learning / AI,
Tôi chỉ là một Người học máy vừa chớm nở và khao khát, người đã làm việc trên các bộ dữ liệu trực tuyến mở và một số POC được xây dựng tại địa phương cho dự án của tôi. Tôi đã xây dựng một số mô hình và chuyển đổi thành các đối tượng dưa chua để tránh đào tạo lại.
Và câu hỏi này luôn đánh đố tôi. Làm thế nào để một hệ thống sản xuất thực sự hoạt động cho các thuật toán ML?
Giả sử, tôi đã đào tạo thuật toán ML của mình với hàng triệu dữ liệu và tôi muốn chuyển nó sang hệ thống sản xuất hoặc lưu trữ nó trên máy chủ. Trong thế giới thực, họ có chuyển đổi thành các đối tượng dưa chua? Nếu vậy, nó sẽ là tập tin ngâm lớn, không. Những cái tôi đã đào tạo cục bộ và chuyển đổi cho 50000 hàng dữ liệu, chính nó đã chiếm 300 Mb dung lượng trên đĩa cho đối tượng được chọn. Tôi không nghĩ rằng đây là cách tiếp cận đúng.
Vậy làm thế nào để nó hoạt động để tránh thuật toán ML của tôi đào tạo lại và bắt đầu dự đoán về dữ liệu đến? Và làm thế nào để chúng ta thực sự tạo ra thuật toán ML như một người học trực tuyến liên tục. Ví dụ, tôi đã xây dựng một trình phân loại hình ảnh và bắt đầu dự đoán các hình ảnh đến. Nhưng tôi muốn một lần nữa đào tạo thuật toán bằng cách thêm các hình ảnh trực tuyến đến vào bộ dữ liệu được đào tạo trước đó của tôi. Có thể không phải cho mọi dữ liệu, nhưng hàng ngày một khi tôi muốn kết hợp tất cả dữ liệu nhận được cho ngày hôm đó và đào tạo lại với 100 hình ảnh mới mà phân loại được đào tạo trước đây của tôi dự đoán với giá trị thực. Và cách tiếp cận này không ảnh hưởng đến thuật toán được đào tạo trước đây của tôi để ngừng dự đoán dữ liệu đến vì việc đào tạo lại này có thể mất thời gian dựa trên tài nguyên tính toán và dữ liệu.
Tôi đã Googled và đọc nhiều bài viết, nhưng không thể tìm hoặc hiểu câu hỏi trên của tôi. Và điều này đang làm tôi bối rối mỗi ngày. Có cần can thiệp thủ công cho các hệ thống sản xuất không? hoặc bất kỳ phương pháp tự động là có cho nó?
Bất kỳ dẫn hoặc câu trả lời cho các câu hỏi trên sẽ rất hữu ích và đánh giá cao. Xin vui lòng cho tôi biết nếu câu hỏi của tôi không có ý nghĩa hoặc không thể hiểu được.
Đây không phải là một dự án trung tâm tôi đang tìm kiếm. Chỉ là một trường hợp chung của ví dụ hệ thống ML sản xuất trong thế giới thực.
Cảm ơn bạn trước!