Stability AI презентує нову версію свого ШІ: Stable Diffusion XL Turbo генерує зображення зі швидкістю друку тексту

автор Vitaliy Kairov 1 Гру, 2023

Компанія Stability AI представила свою нову розробку — Stable Diffusion XL Turbo, що вражає своєю швидкістю генерації зображень. Ця модель штучного інтелекту пропонує “генерацію зображень у режимі реального часу” завдяки унікальній технології, відомої як “змагальна дифузійна дистиляція” (Adversarial Diffusion Distillation, ADD).

Оновлення полягає в тому, що SDXL Turbo здатна створювати зображення за один крок, порівняно з попередніми моделями, які вимагали 20-50 кроків. Це досягнуто завдяки ефективності ADD, яка використовує дистиляцію оцінок та змагальний програш для підвищення реалістичності результатів.

За даними компанії, на графічному процесорі Nvidia A100 модель може згенерувати зображення 512×512 за 207 мс, включаючи всі етапи обробки. Хоча зображення не так деталізовані, як у попередніх моделей, їхня швидкість вражає.

Stability AI випустила цю модель під некомерційною дослідницькою ліцензією, що викликало деяку критику від користувачів. Проте, компанія заявляє про відкритість до комерційних застосувань і навіть запрошує зацікавлених осіб для отримання додаткової інформації.

Бета-демонстрацію можливостей SDXL Turbo можна випробувати на платформі для редагування зображень Clipdrop від Stability AI, а також скористатися неофіційним live demo на Hugging Face.

Це ще один крок компанії у напрямку розвитку технологій глибинного навчання, підтверджений попереднім випуском моделі Stable Video Diffusion, яка може перетворювати статичні зображення відео.

Джерело Ars Technica