Google представила нейромережу, що генерує музику за текстовим описом

Google анонсувала MusicLM – це найновіший генеративний штучний інтелект, який може перетворювати текстові описи різної складності на якісну музику.

Розробники відзначають, що моделі перетворення тексту на музику не нові, але MusicLM перевершує попередні системи як за якістю звуку, так і за дотриманням текстового опису.

Нейросеть навчили на 280 тисяч годинах музики, щоб вона могла справлятися зі складними запитами. Усі мелодії створюються на частоті 24 кГц, яка залишається незмінною протягом кількох хвилин.

У прикладах на сайті Google представлені 30-секундні фрагменти, згенеровані буквально за парою пропозицій.

MusicLM здатна генерувати музику різних жанрів і навіть відтворювати рівень музичного досвіду (наприклад, початківець або професіонал). У майбутньому Google може зайнятися створенням текстів пісень, покращенням якості вокалу та підвищенням частоти дискретизації.

Поки що викладати MusicLM у відкритий доступ розробники не планують.