Компанія Google оголосила про запуск двох нових моделей штучного інтелекту для платформи Vertex AI – Imagen 3 та Veo. Ці моделі можуть працювати окремо або разом, забезпечуючи нові можливості для створення зображень і анімацій.
Модель Imagen 3 значно перевершує попередні версії, забезпечуючи високий рівень деталізації, покращене освітлення та зниження артефактів. Вона стане доступною для всіх користувачів Vertex AI вже наступного тижня.
Додаткові функції:
- Inpainting – додавання нових елементів до існуючого зображення.
- Outpainting – розширення зображення за межі його початкових кордонів.
- Product background – автоматична заміна фону.
Користувачі також можуть використовувати референсні зображення для адаптації стилю, логотипу чи продукту під час генерації. Google називає це можливістю “персоналізації Imagen 3”.
Модель Veo, наразі доступна в приватному попередньому перегляді, дає змогу анімувати статичні зображення, використовуючи текстові підказки. Вона також може створювати відео “з нуля”, ґрунтуючись лише на текстовому описі.
Обидві моделі мають вбудовані захисні механізми:
- Вихідні файли непомітно маркуються за допомогою технології SynthID від DeepMind, що унеможливлює видавання згенерованих зображень за справжні.
- Фільтри безпеки блокують створення шкідливого контенту.
- Google запевняє, що клієнтські дані не використовувалися для навчання моделей, і надає гарантію авторського права.
Нові моделі відкривають широкі можливості для бізнесу:
- Imagen 3 дозволяє брендам інтегрувати свій стиль у візуальний контент.
- Veo стане корисним інструментом для створення анімацій та відео в різних галузях – від реклами до освіти.
З появою цих інновацій Google зміцнює свої позиції у сфері генеративного штучного інтелекту, пропонуючи безпечні та функціональні інструменти для креативних і бізнес-задач.