MIT хоче створити універсальний мозок для роботів, який працюватиме як GPT-4

Цього тижня команда MIT продемонструвала нову модель навчання роботів, яка кардинально змінює традиційний підхід. Замість використання вузькоспеціалізованих наборів даних для навчання роботів, дослідники взяли за основу методологію, подібну до тієї, що використовується у великих мовних моделях (LLM) на кшталт GPT-4.

Як зауважують науковці, підхід навчання через імітацію — коли робот повторює дії людини — може давати збій у непередбачуваних ситуаціях, таких як зміна освітлення, нові об’єкти чи інші перешкоди. В таких випадках робот просто не має достатньо даних для того, щоб швидко адаптуватись до нових умов.

Щоб розв’язати цю проблему, команда MIT розглянула можливість застосування підходу з використанням величезних обсягів різноманітних даних, як це роблять великі мовні моделі. Як пояснив Ліруї Ван, провідний автор нового дослідження, “в мовному домені дані — це просто речення. Але в робототехніці, враховуючи всю неоднорідність інформації, потрібна особлива архітектура для попереднього навчання.”

Щоб забезпечити роботам доступ до великого масиву даних, команда розробила архітектуру під назвою “гетерогенний попередньо навчений трансформер” (HPT). Ця технологія об’єднує дані від різноманітних сенсорів та з різних середовищ. Застосувавши трансформер, дослідники змогли зібрати всі ці дані в єдину модель навчання. Результати показують, що більший обсяг даних дає кращі результати у навчанні роботів.

Система дозволяє користувачам вводити дизайн робота, конфігурацію та завдання, яке необхідно виконати. В майбутньому це може створити універсальну “мозкову систему” для роботів.

Асистент професора CMU Девід Хелд, коментуючи дослідження, висловив надію на розробку універсального роботизованого мозку: “Наша мрія — мати універсальний мозок для роботів, який можна буде завантажити й одразу використовувати без додаткового навчання. Ми лише на початку цього шляху, але плануємо докладати максимум зусиль для прориву в цій галузі, як це сталося з великими мовними моделями.”

Це дослідження частково фінансувалося Toyota Research Institute (TRI), який минулого року презентував інноваційний метод нічного навчання роботів. Нещодавно TRI також оголосив про важливе партнерство з Boston Dynamics, щоб об’єднати свої напрацювання в області робототехніки.