Штучний інтелект навчили підробляти голос за декілька секунд

автор Olena Iakovenko 1 Жов, 2019

Звучання компютерного голосу чимдуж природніше – це те, над чим працюють сьогодні IT-компанії і гігантські корпорації з усього світу. І у них вже є результати – новий алгоритм, заснований на базі штучного інтелекту, уже через 5 хвилин після ознайомлення з людським голосом зміг повністю відтворити його. Це стосується будь-якого тексту.

За запевненням IBM, новий ІІ-алгоритм здатний в режимі реального часу будувати діалоги і адаптуватися до різних стилів розмови і тембрів голосу. Фахівці компанії відзначають, що завдяки синтезу нейронної мови на основі модульної архітектури їм «вдалося створити реалістичний комп’ютерний голос».

Система складається з трьох складових частин: предиктора функції просодії, предиктора акустичних характеристик і нейронного вокодера. Спільно всі три компоненти дозволяють максимально точно визначити стиль мовця, а також підлаштувати висоту і енергію подачі мови з урахуванням акустичних спотворень. За даними компанії, для навчання нейромережі досить лише п’яти хвилин прослуховування співрозмовника.

Джерело venturebeat.com