Новий інструмент OpenAI може клонувати ваш голос всього за 15 секунд

автор Kairov Vitaliy 31 Бер, 2024

OpenAI знову розбурхує сектор новин про штучний інтелект, цього разу привертаючи увагу новим інструментом під назвою Voice Engine, який, на жаль, ніколи не побачить світ. Ця вражаюча технологія може генерувати реалістичні синтетичні голоси після навчання на 15-секундному аудіозразку. Це відкриває цілий новий світ можливостей, який немов зійшов зі сценарію якогось шпигунського бойовика.

Уявіть собі інструмент, який може прочитати будь-який текст природним голосом, навіть імітуючи емоції. Це потенціал Voice Engine, який наразі використовується в обмеженій попередній версії для функції читання вголос у додатку ChatGPT від OpenAI. За межами розваг можливості застосування дуже широкі. Voice Engine може зробити революцію в освіті, перекладати подкасти новими мовами та надавати допомогу в спілкуванні людям з невербальною мовою. Нижче – приклад референсного та згенерованого аудіо, інші – у блозі компанії.

Однак, потужність цієї технології приходить з відповідальністю. OpenAI визнає потенціал для зловживань, таких як поширення дезінформації або імітація чийогось голосу. З цієї причини Voice Engine поки що залишається в таємниці. OpenAI прагне вирішити ці проблеми за допомогою досліджень і відкритого обговорення. Вони сподіваються визначити найкращий спосіб розгортання цього потужного інструменту та підготувати суспільство до нової ери, орієнтованої на штучний інтелект.

Цей фокус на відповідальному розвитку має вирішальне значення. Оскільки діпфейки та інший контент, створений штучним інтелектом, стають все більш правдоподібними, здатність відрізнити справжнє від штучного стає все складнішою. OpenAI визнає, що існують проблеми, зокрема потенційні проблеми з голосовою автентифікацією та телефонним шахрайством. Пошук рішень цих проблем буде мати вирішальне значення в міру розвитку технології синтетичного голосу. Залишається тільки чекати й спостерігати.

Джерело TechRadar

OpenAI