Человекоподобный робот Eve продемонстрировал умение понимать человека (видео)
Робототехническая компания 1X (ранее известная как Halodi Robotics) продемонстрировала значительный прогресс в робототехнике, представив своего человекоподобного робота Eve. Этот робот теперь может выполнять долгие последовательности задач с помощью голосовых команд на естественном языке, что является важным моментом в развитой отрасли.
Об этом пишет New Atlas.
В 2022 году 1X заключили партнерство с OpenAI, чтобы объединить робототехнику с искусственным интеллектом, заложив основу для воплощенного обучения. Это партнерство подтолкнуло 1X к созданию роботов, которые могут понимать и выполнять сложные реальные задачи в разных средах, в том числе на рабочих местах.
На последней демонстрации был представлен Eve — колесный сервисный робот, выполнявший ряд задач по уборке помещения, руководствуясь командами на естественном языке.
Это стало возможным благодаря инновационному интерфейсу управления роботом от 1X, который интерпретирует высокоуровневые речевые команды. Этот интерфейс позволяет одному оператору управлять несколькими человекоподобными работами одновременно, повышая эффективность и операционную способность.
В блоге компании подробно описан новый пользовательский опыт, обеспечивающий этот высокоуровневый речевой интерфейс.
Вместо традиционного метода использования виртуальной реальности (VR) для управления одним роботом операторы теперь могут управлять несколькими работами с помощью сжатых команд высокого уровня. Этот метод уменьшает частоту подачи команд, что делает дистанционное управление работами более эффективным.
Примечательно, что 1X утверждает, что действия, выполняемые Ева в демонстрационном видео, полностью контролируются нейронной сетью без какого-либо дистанционного управления. Видео представлено без какой-либо компьютерной графики, монтажа, ускоренной съемки или воспроизведения траектории по сценарию, что гарантирует достоверность возможностей работы.
В будущем 1X планирует интегрировать в свои системы управления большие речевые модели, такие как GPT-4o, VILA и Gemini Vision. Эта интеграция стремится еще больше повысить сложность и автономность их роботов, расширяя границы возможного в сотрудничестве между человеком и роботом.
Теги: роботов