Штучний інтелект, який перетворює текст на зображення, зараз став справжнім мейнстримом, але аналогічні нейромережі для відео лише набирають обертів. В авангарді цього напрямку стоїть стартап Runway, який випустив уже другу модель ШІ, що генерує короткі ролики за кількома словами.
Runway пропонує веб-редактор відео, який спеціалізується на інструментах машинного навчання, для видалення фону. Ця компанія допомогла розробити модель перетворення тексту зображення Stable Diffusion, а в лютому анонсувала свою першу модель редагування відео на основі штучного інтелекту Gen-1.
Gen-1 була зосереджена на перетворенні існуючих відеоматеріалів, дозволяючи користувачам застосовувати накладення певного стилю з картинки на ролик. Модель Gen-2 більше орієнтована створення відео з нуля.
Демонстраційні ролики, якими поділилися в Runway, короткі, нестабільні і точно не фотореалістичні, але навіть такі кадри непогано демонструє розуміння ШІ тривимірного простору, пропорцій та логіки переміщення об’єктів.
Поки Gen-2 немає у вільному доступі, але представник Runway запевнив, що компанія «надасть широкий доступ у найближчі тижні».
Перспективи запровадження такого ШІ вже лякають експертів. Адже нейромережі для роботи з відео обіцяють не лише нові творчі можливості, а й нові види дезінформації.