Gemini Robotics: AI của Google dạy robot thích nghi với thế giới thực

theanh

Administrator
Nhân viên
Ngành công nghiệp này đã tìm ra một sở thích mới: robot. Amazon, Meta, Apple, Tesla và nhiều công ty khác đang đầu tư mạnh vào lĩnh vực mới nổi này, với tham vọng cung cấp cho mỗi gia đình một (hoặc nhiều hơn!) robot để cuộc sống hàng ngày của chúng ta trở nên dễ dàng hơn.

Điều gì sẽ xảy ra nếu robot cuối cùng cũng hiểu được môi trường của chúng?​

Nhưng trước đó, chúng ta sẽ cần những chú robot này có bộ não để chúng có thể thích nghi với môi trường và xử lý các tình huống bất ngờ. Google hiểu rõ điều này: bộ phận DeepMing của công ty đã tiết lộ Gemini Robotics, một mô hình AI dựa trên Gemini 2.0. Ông được thiết kế để cung cấp cho robot "trí thông minh" có khả năng thích nghi và tương tác trong thế giới vật lý.
Có hai phiên bản đã được trình bày: Gemini Robotics nói ngắn gọn là một mô hình đa phương thức (VMA là viết tắt của thị giác-ngôn ngữ-hành động) giúp robot có khả năng hiểu các hướng dẫn và thực hiện mọi loại nhiệm vụ. Phiên bản này được thiết kế để thích ứng với các tình huống mới, xử lý các vật thể lạ và thực hiện các nhiệm vụ chưa từng gặp trong quá trình đào tạo, được Google mô tả là "tính tổng quát".

Gemini Robotics cũng phải chứng minh được "tính tương tác" bằng cách hiểu và phản hồi các hướng dẫn bằng ngôn ngữ tự nhiên. Mô hình phải liên tục theo dõi môi trường và điều chỉnh hành động cho phù hợp và theo thời gian thực. Cuối cùng, cũng có câu hỏi về "khéo léo": được trang bị Nhờ mô hình này, robot có thể thực hiện các thao tác rất chính xác, chẳng hạn như gấp một tờ giấy hoặc bỏ đồ vật vào túi nhựa.
Tất cả những điều này cho phép robot, ví dụ, lập lại ngay lập tức hành động của mình nếu một vật thể trượt khỏi tay hoặc bị di chuyển. Google cũng trình làng Gemini Robotics-ER: một phiên bản chuyên về suy luận không gian và tương tác với môi trường. Mô hình này cải thiện khả năng nhận thức 3D, lập kế hoạch và tạo mã để thực hiện các hành động chính xác.

Khi được đưa cho một tách cà phê, rô-bốt có mô hình Robotics-ER có thể xác định một cách trực quan rằng nó nên sử dụng ổ cắm hai ngón tay để nắm lấy tay cầm và tính toán quỹ đạo an toàn để tiếp cận nó.

Một trong những đối tác đầu tiên của Google trong lĩnh vực này là Apptronik, nơi đang phát triển Apollo, một rô-bốt hình người. Không nói rõ Mặc dù sau này có thể tích hợp Gemini Robotics, mục tiêu của sự hợp tác này là tạo ra những con robot có khả năng thực hiện các nhiệm vụ trong thế giới thực bằng công nghệ này. Gemini Robotics do đó có thể được sử dụng trên một số loại robot, bao gồm cả cánh tay và hai chi của robot.

Nguồn: Google
 
Back
Bên trên