Là động học nghịch đảo và củng cố học các kỹ thuật cạnh tranh?


7

động học nghịch đảocủng cố các kỹ thuật học tập tranh chấp các kỹ thuật để giải quyết cùng một vấn đề viz. chuyển động của robot thao tác hoặc cánh tay?

Nhìn lướt qua bài viết trên wikipedia, có vẻ như động học nghịch đảo dường như cố gắng đạt được một giải pháp trái ngược với việc học tăng cường nhằm cố gắng tối ưu hóa vấn đề. Tôi có hiểu lầm gì không?

Câu trả lời:


10

Từ những gì tôi hiểu về câu hỏi của bạn, bạn muốn biết liệu động học ngược và học tăng cường có đang cố gắng giải quyết vấn đề tương tự trong trường hợp cụ thể của thao tác robot. Tất nhiên cả hai kỹ thuật này đều có thể được áp dụng bên ngoài lĩnh vực cụ thể này, nhưng bây giờ chúng ta hãy tập trung vào thao tác robot.

Bạn đúng rằng động học nghịch đảo đang cố gắng tìm một giải pháp, mặc dù đây có thể là một nhóm các giải pháp. Bạn muốn đặt tác nhân cuối cùng của người thao tác vào một vị trí cụ thể và bạn phải tìm ra trạng thái của phần còn lại của cánh tay để thực hiện các chuyển động sẽ đạt được mục tiêu của bạn.

Học tăng cường cũng đang cố gắng tìm giải pháp cho vấn đề và nó đang cố gắng tối ưu hóa giải pháp của mình đối với hàm chi phí. Ví dụ, hãy tưởng tượng rằng có một bộ chuyển động tối thiểu sẽ đưa tác nhân cuối của bạn vào vị trí cần thiết (ví dụ: bằng cách gắn chi phí để kích hoạt từng khớp của người thao tác, bạn có thể tìm hiểu cách tối ưu để đạt được mục tiêu của mình đối với sức mạnh tiêu thụ).

Thay vì xem xét các kỹ thuật là bất hòa với nhau, bạn có thể sử dụng động học nghịch đảo để tìm ra giải pháp cho vấn đề của mình và củng cố việc học để tìm kiếm không gian này và tìm một giải pháp tối ưu theo một số tiêu chí chi phí / phần thưởng mà bạn chọn .

Nếu bạn có ý định chọn một kỹ thuật khác, bằng cách đặt vấn đề học tăng cường là tối ưu hóa phần thưởng, giả sử, bạn đạt được trạng thái mục tiêu của hiệu ứng kết thúc nhanh như thế nào, bạn vẫn có thể tìm ra giải pháp. Tuy nhiên, có một cơ hội mà bạn muốn sử dụng một số khái niệm về động học của người thao tác để thông báo cho bạn cách tìm kiếm không gian chuyển động của nó.


2

Nếu bạn xem xét ví dụ như một cánh tay robot, động học nghịch đảo sẽ cho bạn biết cách chọn góc khớp của cánh tay để di chuyển cánh tay đến một vị trí và hướng mà bạn muốn đặt.

Ngược lại với việc xác định động lực học phía trước của một số cơ chế, việc xác định động học nghịch đảo của nó thường khó và đôi khi, thậm chí không có giải pháp phân tích. Tuy nhiên, robot công nghiệp thường được thiết kế theo cách mà chúng có giải pháp phân tích cho động học nghịch đảo. Điều này có thể đạt được bằng cách ví dụ thông minh các trục khớp.

Học tập củng cố , mặt khác, là một kỹ thuật học máy. Giống như bất kỳ kỹ thuật hoặc thuật toán học máy nào khác, nó có thể được sử dụng để xác định hàm mà bạn không biết - với điều kiện bạn chọn một hàm phần thưởng tốt có liên quan đến vấn đề bạn muốn giải quyết.

Vì vậy, một cách ngắn gọn: bạn có thể sử dụng Học tăng cường để xác định động học nghịch đảo của robot (nếu không có giải pháp phân tích hoặc xác định người ta sẽ khó khăn một cách lố bịch).


Đọc câu trả lời của bạn, người ta có thể có ấn tượng mạnh mẽ rằng RL thích hợp hơn IK tiêu chuẩn: điều đó không đúng, dứt khoát. RL mang lại sự hội tụ rất chậm và tạo ra kết quả không chính xác, trong khi IK dựa vào các kỹ thuật tối ưu hóa phi tuyến thì nhanh và mạnh và được sử dụng trong công nghiệp như các lĩnh vực nghiên cứu. Sau đó, để bù đắp cho sự không chắc chắn trong mô hình CAD của trình thao tác được IK sử dụng (chúng tôi thực hiện điều đó trong nghiên cứu không phải trong các thiết lập công nghiệp), chúng tôi có xu hướng dựa vào các phương pháp ML khác nhau thay vì RL (ví dụ: SVM, GP ...).
Ugo Pattacini
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.