Штучний інтелект навчили підробляти голос за декілька секунд
Звучання компютерного голосу чимдуж природніше – це те, над чим працюють сьогодні IT-компанії і гігантські корпорації з усього світу. І у них вже є результати – новий алгоритм, заснований на базі штучного інтелекту, уже через 5 хвилин після ознайомлення з людським голосом зміг повністю відтворити його. Це стосується будь-якого тексту.
За запевненням IBM, новий ІІ-алгоритм здатний в режимі реального часу будувати діалоги і адаптуватися до різних стилів розмови і тембрів голосу. Фахівці компанії відзначають, що завдяки синтезу нейронної мови на основі модульної архітектури їм «вдалося створити реалістичний комп’ютерний голос».
Система складається з трьох складових частин: предиктора функції просодії, предиктора акустичних характеристик і нейронного вокодера. Спільно всі три компоненти дозволяють максимально точно визначити стиль мовця, а також підлаштувати висоту і енергію подачі мови з урахуванням акустичних спотворень. За даними компанії, для навчання нейромережі досить лише п’яти хвилин прослуховування співрозмовника.