Học trực tuyến vs học ngoại tuyến?


38

Sự khác biệt giữa học ngoại tuyến và trực tuyến là gì? Có phải chỉ là vấn đề học trên toàn bộ dữ liệu (ngoại tuyến) so với học tăng dần (mỗi lần một lần)? Các ví dụ về các thuật toán được sử dụng trong cả hai là gì?

Câu trả lời:


26

Học trực tuyến có nghĩa là bạn đang thực hiện khi dữ liệu đến. Ngoại tuyến có nghĩa là bạn có bộ dữ liệu tĩnh.

Vì vậy, đối với việc học trực tuyến, bạn (thường) có nhiều dữ liệu hơn, nhưng bạn có những hạn chế về thời gian. Một nếp nhăn khác có thể ảnh hưởng đến việc học trực tuyến là các khái niệm của bạn có thể thay đổi theo thời gian.

Giả sử bạn muốn xây dựng một trình phân loại để nhận ra thư rác. Bạn có thể có được một lượng lớn thư điện tử, dán nhãn và huấn luyện một trình phân loại trên đó. Đây sẽ là học ngoại tuyến. Hoặc, bạn có thể đưa tất cả e-mail vào hệ thống của mình và liên tục cập nhật trình phân loại của bạn (nhãn có thể hơi khó). Đây sẽ là học trực tuyến.


7
Có, và một điều rõ ràng là các thuật toán học trực tuyến, ít nhất là được nghiên cứu trong Machine Learning, chủ yếu đưa ra giả định rằng khả năng lưu trữ các ví dụ của bạn rất hạn chế so với kích thước của tập dữ liệu. Trong trường hợp hạn chế nhất, bạn chỉ được xem một ví dụ tại một thời điểm và sau đó bạn phải quên nó sau khi bạn đã sử dụng nó để cập nhật trình phân loại của mình.
Harlan

8

Thuật ngữ "trực tuyến" bị quá tải, và do đó gây ra sự nhầm lẫn trong lĩnh vực học máy.

Trái ngược với "trực tuyến" là học tập theo đợt. Trong học tập theo đợt, thuật toán học tập cập nhật các tham số của nó sau khi tiêu thụ toàn bộ lô, trong khi học trực tuyến, thuật toán cập nhật các tham số sau khi học từ 1 trường hợp đào tạo. Học theo đợt nhỏ là nửa điểm giữa học theo đợt ở một đầu và học trực tuyến ở một thái cực khác.

Ngoài ra, "khi" dữ liệu đến, hoặc liệu nó có khả năng được lưu trữ hay không, là trực giao cho việc học trực tuyến hoặc theo đợt.

Học trực tuyến được coi là chậm hơn để hội tụ đến mức tối thiểu, khi so sánh với học tập theo đợt. Tuy nhiên, trong trường hợp toàn bộ tập dữ liệu không phù hợp với bộ nhớ, sử dụng học trực tuyến là một sự đánh đổi chấp nhận được.


Tôi không nghĩ điều này là đúng. Những gì bạn mô tả là giảm dần độ dốc thuật toán ngẫu nhiên (hoặc trực tuyến) có thể được sử dụng cho cả cài đặt vấn đề trực tuyến hoặc ngoại tuyến.
danijar

Tôi tin rằng "khi dữ liệu xuất hiện" đề cập đến các thuật toán trực tuyến và ngoại tuyến en.wikipedia.org/wiki/Online_alacticm Tôi cảm thấy rằng OP không được học trực tuyến rõ ràng tạo nên sự khác biệt này. Algos trực tuyến -> xử lý khi có dữ liệu. Học trực tuyến -> cập nhật mô hình cơ bản dần dần trong quá trình đào tạo.
gokul_uf

4

Học trực tuyến (còn gọi là học tăng dần ): chúng tôi xem xét một bài trình bày về các ví dụ. Trong trường hợp này, mỗi ví dụ được sử dụng tuần tự theo cách thức được quy định bởi thuật toán học tập, và sau đó vứt đi. Sự thay đổi trọng lượng được thực hiện ở một giai đoạn nhất định chỉ phụ thuộc vào ví dụ (hiện tại) được trình bày và có thể vào trạng thái hiện tại của mô hình. Đây là quy trình tự nhiên cho các quy tắc thay đổi thời gian trong đó các ví dụ có thể không có sẵn cùng một lúc.

Học ngoại tuyến : sự thay đổi trọng lượng phụ thuộc vào toàn bộ tập dữ liệu (đào tạo), xác định hàm chi phí toàn cầu. Các ví dụ được sử dụng nhiều lần cho đến khi đạt được tối thiểu hóa hàm chi phí này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.