Làm thế nào để Atlas từ Boston Dynamics có chuyển động giống con người?


8

Thảo luận về video Thêm Parkour Atlas, một người bạn đã hỏi làm thế nào chuyển động của robot giống với người từ người thật và tự hỏi làm thế nào đạt được điều này?

Theo hiểu biết của tôi, đây không phải là thứ mà nhà phát triển "lập trình", mà thay vào đó nổi lên từ việc học thuật toán.

Bạn có thể cung cấp một cái nhìn tổng quan và một số tài liệu tham khảo về cách đạt được điều này?


Theo bài báo Yang Yang, Xiong, et al. Nhà nước của nghệ thuật: Robot hai chân để phục hồi chức năng chi dưới. Khoa học ứng dụng 7.11 (2017): 1182. chuyển động giống như con người được thực hiện bằng cách bắt chuyển động của con người đi bộ. Sau đó, tín hiệu được đưa vào một kế hoạch dáng đi đang tái tạo chuyển động trên robot.
Manuel Rodriguez

Câu trả lời:


1

Chào mừng bạn đến với AI.SE @EdouardLopez!

Bởi vì Boston Dynamics là một công ty tư nhân, vì lợi nhuận, chúng tôi không thể biết chắc chắn làm thế nào họ đạt được kết quả của họ. Tuy nhiên, chúng ta có thể kiểm tra thông tin công khai có sẵn và đưa ra những phỏng đoán có giáo dục.

Trong thông tin được đăng tải cùng với video, Boston Dynamics cho chúng tôi biết rằng họ sử dụng

... Một thuật toán tối ưu hóa biến các mô tả cấp cao của từng thao tác thành các chuyển động tham chiếu khả thi động. Sau đó, Atlas theo dõi các chuyển động bằng cách sử dụng bộ điều khiển dự báo mô hình kết hợp nhuần nhuyễn từ thao tác này sang thao tác tiếp theo.

Âm thanh này giống như ba phương pháp tiếp cận AI cũ hơn đã được pha trộn với nhau để tạo ra video.

Đầu tiên, họ đề cập đến việc sử dụng một thuật toán tối ưu hóa để lắp ráp các chuyển động phức tạp từ "các chuyển động tham chiếu khả thi động". Điều này nghe có vẻ như lần đầu tiên họ học, hoặc có thể được lập trình sẵn, một loạt các chuyển động đơn giản, tự chúng không ấn tượng lắm, nhưng có thể được kết hợp thành các chuyển động phức tạp hơn. Cách tiếp cận này được gọi là Học tập theo lớp , và được Peter Stone và Manuela Veloso tiên phong vào cuối những năm 1990. Nó được sử dụng rộng rãi và thành công trong các cuộc thi robot học thuật. Về cơ bản, thuật toán này thử các kết hợp và chuỗi các hành động đơn giản khác nhau cho đến khi tìm thấy một kết hợp gần với hành động phức tạp mong muốn. Điều này thường được thực hiện với một thuật toán tìm kiếm cục bộ hoặc đôi khi với các công cụ tối ưu hóa khác.

Tất nhiên, kỹ thuật thứ hai là thực sự học cách thực hiện các hành động cơ bản mà việc học theo lớp có thể kết hợp thành các hành động phức tạp hơn. Điều này thường được thực hiện với một số hình thức học tăng cường , nhưng đôi khi được thực hiện bởi một lập trình viên giải quyết rõ ràng các phương trình cho sự chuyển động của một hệ thống đơn giản.

Cuối cùng, họ cần sử dụng một bộ điều khiển dự báo mô hình để nội suy trơn tru giữa chuỗi hành động mà phương pháp học tập theo lớp đã đưa ra. Theo cách tiếp cận này, các kỹ sư thiết kế robot đã đo rất cẩn thận, đối với robot cụ thể này, chính xác cách các bộ phận của nó có xu hướng di chuyển hoặc tiếp tục di chuyển, và viết nó thành một mô hình toán học gọi là hệ thống động lực. Mô hình này cho phép thuật toán tìm ra cách các chuyển động của robot cụ thể này trượt khỏi các kế hoạch khi nó thực hiện các chuyển động. Sự trượt xảy ra do những thứ như ma sát (các bộ phận của robot không hoàn toàn trơn tru và có thể có lượng bôi trơn khác nhau, hoặc một động cơ có thể bị trượt). Thuật toán sau đó có thể thực hiện các thay đổi nhỏ cho chuyển động để làm dịu đi những va chạm bất ngờ này. Đó là phần làm cho mọi thứ trông rất trơn tru.

Điều đáng chú ý nữa là video không đại diện đầy đủ cho kết quả điển hình mà thuật toán của họ thu được. Boston Dynamics tuyên bố trong chú thích video rằng thuật toán của họ "thành công" trong việc đạt được chuyển động mong muốn khoảng 80% thời gian. Họ không cho chúng tôi biết "thành công" nghĩa là gì, nhưng video có lẽ chỉ là phần hay nhất trong số rất nhiều thời gian cho một thói quen được lên kế hoạch và quay phim cẩn thận.


Điều khiển dự báo mô hình được biết đến với các vấn đề về hiệu suất theo các ràng buộc thời gian thực. Cho đến khi bộ điều khiển chế độ trượt đã ước tính các trạng thái trong tương lai của hệ thống, thực tế sẽ nhanh hơn nhiều và dự đoán sẽ đến quá muộn. Điều này làm cho nó trở thành một lựa chọn kém so với điều khiển Tích phân theo tỷ lệ thông thường.
Manuel Rodriguez

@ManuelRodriguez Điều đó cũng có thể đúng, nhưng tôi không chắc nó phải làm gì với câu hỏi này. Boston Dynamics cho chúng tôi biết họ đang sử dụng bộ điều khiển dự báo mô hình. Có lẽ họ cũng đã sử dụng một lượng sức mạnh tính toán rất lớn. Tôi không thấy khó tin rằng đó là những gì họ đang sử dụng ở đây.
John Doucette
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.