Runway запускає нову модель нейромережі для створення відео за текстовим описом

Штучний інтелект, який перетворює текст на зображення, зараз став справжнім мейнстримом, але аналогічні нейромережі для відео лише набирають обертів. В авангарді цього напрямку стоїть стартап Runway, який випустив уже другу модель ШІ, що генерує короткі ролики за кількома словами.

Runway пропонує веб-редактор відео, який спеціалізується на інструментах машинного навчання, для видалення фону. Ця компанія допомогла розробити модель перетворення тексту зображення Stable Diffusion, а в лютому анонсувала свою першу модель редагування відео на основі штучного інтелекту Gen-1.

Gen-1 була зосереджена на перетворенні існуючих відеоматеріалів, дозволяючи користувачам застосовувати накладення певного стилю з картинки на ролик. Модель Gen-2 більше орієнтована створення відео з нуля.

Відео, створене штучним інтелектом з використанням підказки «Захід сонця крізь вікно в нью-йоркській квартирі» / Runway

Демонстраційні ролики, якими поділилися в Runway, короткі, нестабільні і точно не фотореалістичні, але навіть такі кадри непогано демонструє розуміння ШІ тривимірного простору, пропорцій та логіки переміщення об’єктів.

Поки Gen-2 немає у вільному доступі, але представник Runway запевнив, що компанія «надасть широкий доступ у найближчі тижні».

Перспективи запровадження такого ШІ вже лякають експертів. Адже нейромережі для роботи з відео обіцяють не лише нові творчі можливості, а й нові види дезінформації.


Не пропустіть