Học tự giám sát trong học máy là gì?


Câu trả lời:


27

Học tự giám sát (hoặc tự giám sát) là một kỹ thuật học tập tương đối gần đây (trong học máy) trong đó dữ liệu đào tạo được tự động (hoặc tự động) được dán nhãn. Nó vẫn được giám sát việc học, nhưng các bộ dữ liệu không cần phải được gắn nhãn thủ công bởi con người, nhưng chúng có thể được gắn nhãn bằng cách tìm và khai thác mối quan hệ (hoặc tương quan) giữa các tín hiệu đầu vào khác nhau (nghĩa là đầu vào đến từ các phương thức cảm biến khác nhau ).

Một lợi thế tự nhiên và hệ quả của việc học tự giám sát là nó có thể dễ dàng hơn (đối với việc học có giám sát) được thực hiện theo kiểu trực tuyến (với điều kiện là dữ liệu có thể được thu thập và dán nhãn mà không cần sự can thiệp của con người), trong đó các mô hình có thể được cập nhật hoặc Được đào tạo hoàn toàn từ đầu. Do đó, học tập tự giám sát cũng rất phù hợp để thay đổi môi trường, dữ liệu và, nói chung, các tình huống.

Ví dụ, hãy xem xét một robot được trang bị cảm biến tiệm cận (là cảm biến tầm ngắn có khả năng phát hiện vật thể ở phía trước robot ở khoảng cách ngắn) và máy ảnh (là cảm biến tầm xa , nhưng không cung cấp một cách trực tiếp phát hiện đối tượng). Bạn cũng có thể cho rằng robot này có khả năng thực hiện đo hình . Một ví dụ về một robot như vậy là Mighty Thymio .

Bây giờ hãy xem xét nhiệm vụ phát hiện các vật thể ở phía trước robot ở phạm vi dài hơn phạm vi mà cảm biến tiệm cận cho phép. Nói chung, chúng tôi có thể đào tạo một CNN để đạt được điều đó. Tuy nhiên, để đào tạo CNN như vậy, trong học tập có giám sát, trước tiên chúng ta sẽ cần một bộ dữ liệu được gắn nhãn, chứa hình ảnh (hoặc video) có nhãn, trong đó các nhãn có thể là "đối tượng trong hình ảnh" hoặc "không có đối tượng trong hình ảnh". Trong học tập có giám sát, bộ dữ liệu này sẽ cần phải được dán nhãn thủ công bởi con người, điều này rõ ràng sẽ đòi hỏi rất nhiều công việc.

Để khắc phục vấn đề này, chúng ta có thể sử dụng phương pháp học tập tự giám sát. Trong ví dụ này, ý tưởng cơ bản là liên kết đầu ra của các cảm biến tiệm cận ở bước thời gian với đầu ra của máy ảnh ở bước thời gian (bước thời gian nhỏ hơn ).t>ttt

Cụ thể hơn, giả sử rằng robot ban đầu ở tọa độ (trên mặt phẳng), tại bước thời gian . Tại thời điểm này, chúng tôi vẫn chưa có đủ thông tin để gắn nhãn đầu ra của máy ảnh (đồng thời bước ). Giả sử bây giờ, tại thời điểm , robot đang ở vị trí . Ở bước thời gian , đầu ra của cảm biến tiệm cận sẽ là "đối tượng ở phía trước robot" hoặc "không có đối tượng ở phía trước robot". Không mất tính tổng quát, giả sử rằng đầu ra của cảm biến tiệm cận tại là "không có vật thể nào ở phía trước robot",(x,y)ttt(x,y)tt>tt sẽ là "không có đối tượng trước robot".

Để biết thêm chi tiết về ví dụ cụ thể này, hãy xem bài viết về Nhận thức tầm xa bằng cách tự giám sát từ các cảm biến và phép đo tầm ngắn của Mirko Nava, Jérôme Guzzi, R. Omar Chavez-Garcia, Luca M. Gambardella và Alessandro Giusti.

Lưu ý rằng việc học tự giám sát được định nghĩa hơi khác nhau tùy thuộc vào bối cảnh hoặc khu vực, ví dụ, có thể là robot, học tăng cường hoặc học đại diện (hoặc tính năng). Chính xác hơn, định nghĩa được đưa ra ở trên được sử dụng trong robotics. Xem, ví dụ, cũng bài viết này Học tập trực quan tự giám sát đa tác vụ . Đối với một định nghĩa hơi khác về học tập tự giám sát, hãy xem, ví dụ, bài viết Đào sâu vào Ước tính độ sâu một mắt tự giám sát .

Đối với một giới thiệu khác về học tập tự giám sát, hãy xem bài viết trên web này: https://hackernoon.com/elf-supervised-learning-gets-us-closer-to-autonomous-learning-be77e6c86b5a . Trong bài viết này, tác giả cũng so sánh việc học tự giám sát với việc học không giám sát, học bán giám sát và học tăng cường.

Hơn nữa, nếu bạn muốn biết các phương pháp hiện tại đang được sử dụng cho việc tự giám sát, hãy xem bài viết này: https://amitness.com/2020/02/illustrated-elf-supervised-learning . Trong bài viết này, tác giả tóm tắt các ý tưởng chính của các phương pháp tự giám sát hiện có với sơ đồ và trực quan hóa.

Ngoài ra còn có một danh sách các liên kết đến các bài báo trong đó phương pháp học tập này được sử dụng tại URL sau: https://github.com/jason718/awclaw-elf-supervised-learning .


Tôi không đồng ý rằng việc tự giám sát có nghĩa là dữ liệu được dán nhãn, sao cho lớp đầu ra phải lý tưởng bằng các lớp. Lấy điều này và công việc này làm ví dụ, cả hai đều nói rằng họ sử dụng học tập tự giám sát, nhưng không sử dụng bất kỳ nhãn nào. Thay vào đó, tổn thất được tính bằng cách làm cong khung hình trong video theo đầu ra của mạng và so sánh khung bị cong với khung khác.
HelloGoodbye

@Hellooodbye Thực sự có nhiều định nghĩa khác nhau về việc tự học. Tôi nên cập nhật câu trả lời này. Định nghĩa tôi sử dụng là định nghĩa phổ biến nhất và nó được sử dụng trong chế tạo robot. Tất cả những thứ khác không liên quan nhiều đến việc học có giám sát, vì vậy cách sử dụng của chúng hơi không phù hợp hoặc gây hiểu lầm. Cách sử dụng học tập tự giám sát này, trong robotics, là cách thích hợp nhất, dựa trên mối quan hệ của nó với việc học có giám sát.
nbro

2
Cảm ơn vì đã liên kết bài đăng của tôi vào buổi trưa của hacker
Dickey Singh

6

Học tự giám sát là khi bạn sử dụng một số phần của các mẫu làm nhãn cho một nhiệm vụ đòi hỏi mức độ hiểu biết tốt để được giải quyết. Tôi sẽ nhấn mạnh hai điểm chính này, trước khi đưa ra một ví dụ:

  • Các nhãn được trích xuất từ ​​mẫu , do đó chúng có thể được tạo tự động, với một số thuật toán rất đơn giản (có thể chỉ là lựa chọn ngẫu nhiên).

  • Nhiệm vụ đòi hỏi sự hiểu biết . Điều này có nghĩa là, để dự đoán đầu ra, mô hình phải trích xuất một số mẫu tốt từ dữ liệu, tạo ra trên quy trình một biểu diễn tốt.

Một trường hợp rất phổ biến đối với việc học bán giám sát diễn ra trong xử lý ngôn ngữ tự nhiên, khi bạn cần giải quyết một nhiệm vụ nhưng có ít dữ liệu được dán nhãn. Trong những trường hợp như vậy, bạn cần học một mô hình ngôn ngữ hoặc mô hình tốt, vì vậy bạn nhận câu và giao cho các nhiệm vụ tự giám sát mạng của mình như sau:

  • Yêu cầu mạng dự đoán từ tiếp theo trong một câu (mà bạn biết vì bạn đã lấy nó đi).

  • Che dấu một từ và yêu cầu mạng dự đoán từ nào đến đó (mà bạn biết vì bạn phải che dấu từ đó).

  • Thay đổi từ cho một từ ngẫu nhiên (có lẽ không có ý nghĩa) và hỏi mạng từ nào sai.

Như bạn có thể thấy, các tác vụ này khá đơn giản để xây dựng và các nhãn là một phần của cùng một mẫu, nhưng chúng đòi hỏi một sự hiểu biết nhất định về bối cảnh cần được giải quyết.

Và nó luôn như thế này: thay đổi dữ liệu của bạn theo một cách nào đó, tạo nhãn trong quy trình và hỏi mô hình một cái gì đó liên quan đến chuyển đổi đó. Nếu tác vụ đòi hỏi đủ hiểu biết về dữ liệu, bạn sẽ thành công.


2

Nhận dạng hình ảnh tự giám sát thường được áp dụng cho học tập đại diện. Ở đây trước tiên chúng ta tìm hiểu các tính năng trên dữ liệu chưa được gắn nhãn (học đại diện), sau đó tìm hiểu mô hình thực về các tính năng được trích xuất từ ​​dữ liệu được gắn nhãn. Điều này đặc biệt có ý nghĩa khi chúng ta có nhiều dữ liệu chưa được gắn nhãn và ít dữ liệu được dán nhãn.

Các tính năng có thể được học bằng cách giải quyết cái gọi là nhiệm vụ cớ . Ví dụ về các tác vụ trước đó là để dự đoán sự quay của hình ảnh bị xáo trộn, để nhận ra các trường hợp bị xáo trộn của cùng một hình ảnh hoặc dự đoán mối quan hệ không gian của các bản vá hình ảnh.

Một cái nhìn tổng quan tốt đẹp và kết quả thú vị có thể được tìm thấy trong này bài báo gần đây.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.