Розробники Stable Diffusion 3 стверджують, що нова версія генератора зі штучним інтелектом більше не зіпсує текст на зображеннях

автор Vitaliy Kairov 23 Лют, 2024

Stability AI, стартап, що стоїть за Stable Diffusion, інструментом, який використовує генеративний AI для створення зображень із текстових підказок, представив Stable Diffusion 3, модель наступного покоління, у четвер. У компанії стверджують, що нова модель, яка ще не є широко доступною, покращує якість зображення, краще працює з підказками, що містять кілька об’єктів, і може точніше відображати текст як частину згенерованого зображення, тобто робити те, з чим попередні моделі Stable Diffusion справлялись відверто погано.

Генеральний директор Stability AI Emad Mosque опублікував кілька прикладів цього на X.

#SD3 can do quite a lot of text… https://t.co/DfcUzOZymj

— Emad (@EMostaque) February 22, 2024

Оголошення з’явилося через кілька днів після того, як найбільший конкурент Stability AI, OpenAI, представив Sora, абсолютно нову модель штучного інтелекту, здатну генерувати майже реалістичне відео високої чіткості з простих текстових підказок. Sora, яка ще не доступна для широкого загалу, викликала занепокоєння щодо її потенціалу для створення реалістичних фальшивих кадрів.

OpenAI заявив, що працює з експертами з дезінформації та ворожого контенту, щоб перевірити інструмент, перш ніж зробити його широко доступним. Stability AI сказав, що робить те саме.

«[Ми] вжили й продовжуємо вживати розумних заходів, щоб запобігти неправильному використанню Stable Diffusion 3 зловмисниками», — написала компанія в блозі на своєму вебсайті. «Постійно співпрацюючи з дослідниками, експертами та нашою спільнотою, ми очікуємо чесного впровадження інновацій у міру наближення до публічного випуску моделі».

Незрозуміло, коли Stable Diffusion 3 буде випущено для публіки, але до того часу кожен бажаючий може приєднатися до списку очікування.

Джерело Engadget