Sự khác biệt giữa học ngoại tuyến và trực tuyến là gì? Có phải chỉ là vấn đề học trên toàn bộ dữ liệu (ngoại tuyến) so với học tăng dần (mỗi lần một lần)? Các ví dụ về các thuật toán được sử dụng trong cả hai là gì?
Sự khác biệt giữa học ngoại tuyến và trực tuyến là gì? Có phải chỉ là vấn đề học trên toàn bộ dữ liệu (ngoại tuyến) so với học tăng dần (mỗi lần một lần)? Các ví dụ về các thuật toán được sử dụng trong cả hai là gì?
Câu trả lời:
Học trực tuyến có nghĩa là bạn đang thực hiện khi dữ liệu đến. Ngoại tuyến có nghĩa là bạn có bộ dữ liệu tĩnh.
Vì vậy, đối với việc học trực tuyến, bạn (thường) có nhiều dữ liệu hơn, nhưng bạn có những hạn chế về thời gian. Một nếp nhăn khác có thể ảnh hưởng đến việc học trực tuyến là các khái niệm của bạn có thể thay đổi theo thời gian.
Giả sử bạn muốn xây dựng một trình phân loại để nhận ra thư rác. Bạn có thể có được một lượng lớn thư điện tử, dán nhãn và huấn luyện một trình phân loại trên đó. Đây sẽ là học ngoại tuyến. Hoặc, bạn có thể đưa tất cả e-mail vào hệ thống của mình và liên tục cập nhật trình phân loại của bạn (nhãn có thể hơi khó). Đây sẽ là học trực tuyến.
Thuật ngữ "trực tuyến" bị quá tải, và do đó gây ra sự nhầm lẫn trong lĩnh vực học máy.
Trái ngược với "trực tuyến" là học tập theo đợt. Trong học tập theo đợt, thuật toán học tập cập nhật các tham số của nó sau khi tiêu thụ toàn bộ lô, trong khi học trực tuyến, thuật toán cập nhật các tham số sau khi học từ 1 trường hợp đào tạo. Học theo đợt nhỏ là nửa điểm giữa học theo đợt ở một đầu và học trực tuyến ở một thái cực khác.
Ngoài ra, "khi" dữ liệu đến, hoặc liệu nó có khả năng được lưu trữ hay không, là trực giao cho việc học trực tuyến hoặc theo đợt.
Học trực tuyến được coi là chậm hơn để hội tụ đến mức tối thiểu, khi so sánh với học tập theo đợt. Tuy nhiên, trong trường hợp toàn bộ tập dữ liệu không phù hợp với bộ nhớ, sử dụng học trực tuyến là một sự đánh đổi chấp nhận được.
Học trực tuyến (còn gọi là học tăng dần ): chúng tôi xem xét một bài trình bày về các ví dụ. Trong trường hợp này, mỗi ví dụ được sử dụng tuần tự theo cách thức được quy định bởi thuật toán học tập, và sau đó vứt đi. Sự thay đổi trọng lượng được thực hiện ở một giai đoạn nhất định chỉ phụ thuộc vào ví dụ (hiện tại) được trình bày và có thể vào trạng thái hiện tại của mô hình. Đây là quy trình tự nhiên cho các quy tắc thay đổi thời gian trong đó các ví dụ có thể không có sẵn cùng một lúc.
Học ngoại tuyến : sự thay đổi trọng lượng phụ thuộc vào toàn bộ tập dữ liệu (đào tạo), xác định hàm chi phí toàn cầu. Các ví dụ được sử dụng nhiều lần cho đến khi đạt được tối thiểu hóa hàm chi phí này.