Từ những gì tôi hiểu về câu hỏi của bạn, bạn muốn biết liệu động học ngược và học tăng cường có đang cố gắng giải quyết vấn đề tương tự trong trường hợp cụ thể của thao tác robot. Tất nhiên cả hai kỹ thuật này đều có thể được áp dụng bên ngoài lĩnh vực cụ thể này, nhưng bây giờ chúng ta hãy tập trung vào thao tác robot.
Bạn đúng rằng động học nghịch đảo đang cố gắng tìm một giải pháp, mặc dù đây có thể là một nhóm các giải pháp. Bạn muốn đặt tác nhân cuối cùng của người thao tác vào một vị trí cụ thể và bạn phải tìm ra trạng thái của phần còn lại của cánh tay để thực hiện các chuyển động sẽ đạt được mục tiêu của bạn.
Học tăng cường cũng đang cố gắng tìm giải pháp cho vấn đề và nó đang cố gắng tối ưu hóa giải pháp của mình đối với hàm chi phí. Ví dụ, hãy tưởng tượng rằng có một bộ chuyển động tối thiểu sẽ đưa tác nhân cuối của bạn vào vị trí cần thiết (ví dụ: bằng cách gắn chi phí để kích hoạt từng khớp của người thao tác, bạn có thể tìm hiểu cách tối ưu để đạt được mục tiêu của mình đối với sức mạnh tiêu thụ).
Thay vì xem xét các kỹ thuật là bất hòa với nhau, bạn có thể sử dụng động học nghịch đảo để tìm ra giải pháp cho vấn đề của mình và củng cố việc học để tìm kiếm không gian này và tìm một giải pháp tối ưu theo một số tiêu chí chi phí / phần thưởng mà bạn chọn .
Nếu bạn có ý định chọn một kỹ thuật khác, bằng cách đặt vấn đề học tăng cường là tối ưu hóa phần thưởng, giả sử, bạn đạt được trạng thái mục tiêu của hiệu ứng kết thúc nhanh như thế nào, bạn vẫn có thể tìm ra giải pháp. Tuy nhiên, có một cơ hội mà bạn muốn sử dụng một số khái niệm về động học của người thao tác để thông báo cho bạn cách tìm kiếm không gian chuyển động của nó.