Root NationНовиниIT новиниВ Токио бяха показани успехите на хуманоидния робот Alter3, базиран на GPT-4

В Токио бяха показани успехите на хуманоидния робот Alter3, базиран на GPT-4

-

Екип от университета в Токио представи Alter3, хуманоиден робот, който може да извършва движения, използвайки GPT-4 Large Language Model (LLM). Alter3 използва най-новия инструмент Отворете AI за динамично приемане на различни пози, от поза за селфи до призрак, всичко това без необходимост от предварително програмирани записи в базата данни.

„Отговорът на Alter3 на разговорно съдържание, използвайки изражения на лицето и жестове, е значителен напредък в хуманоидната роботика, която е лесно адаптивна към други андроиди с минимални промени“, казаха изследователите.

Alter3

В областта на интеграцията на LLM с роботи фокусът е върху подобряване на основната комуникация и моделиране на реалистични отговори. Изследователите също се задълбочават във възможностите на LLM, за да позволят на роботите да разбират и изпълняват сложни инструкции, като по този начин увеличават тяхната функционалност.

Традиционно управление на ниско ниво върши работа е свързано с хардуера и е извън обхвата на LLM корпорациите. Това създава трудности при директното управление на работи, базирани на LLM. Решавайки този проблем, японският екип разработи метод за преобразуване на изрази на човешки движения в код, разбираем за Android. Това означава, че роботът може независимо да генерира последователности от действия във времето, без да е необходимо разработчиците да програмират индивидуално всяка част от тялото.

По време на взаимодействието човек може да даде команди на Alter3 като „Направете селфи с вашия iPhone“. Впоследствие роботът инициира серия от заявки към GPT-4, за да получи указания за необходимите стъпки. GPT-4 ще преведе това в код на Python, който позволява на работата да „разбира“ и да извършва необходимите движения. Тази иновация позволява на Alter3 да движи горната част на тялото си, докато долната му част остава неподвижна, прикрепена към стойката.

Alter3 е третата итерация в серията хуманоидни роботи на Alter от 2016 г., разполагаща с 43 задвижващи механизма, отговорни за израженията на лицето и движенията на крайниците, задвижвани от сгъстен въздух. Тази конфигурация предоставя широка гама от изразителни жестове. Роботът не може да ходи, но може да имитира типични движения при ходене и бягане.

Alter3 също демонстрира способността да копира човешки пози с помощта на камерата и рамката OpenPose. Роботът настройва ставите си към наблюдаваните пози и запазва успешни имитации за по-късна употреба. Взаимодействието с човек доведе до по-разнообразни пози, подкрепящи идеята, че различните движения идват от имитиране на човека, подобно на начина, по който новородените учат чрез имитация.

Преди LLM изследователите трябваше внимателно да контролират всичките 43 задвижващи механизма, за да пресъздадат позата на човек или да симулират поведение, като сервиране на чай или игра на шах. Това изисква много ръчни настройки, но AI помогна за освобождаването на екипа от тази рутина. „Очакваме Alter3 ефективно да се включи в диалог чрез показване на релевантни за контекста изражения на лицето и жестове. Той демонстрира способността да отразява емоциите, например да показва тъга или щастие в отговор, като по този начин споделя емоции с нас", казват изследователите.

Прочетете също:

Регистрирай се
Уведомете за
гост

0 Коментари
Вградени рецензии
Вижте всички коментари