Релизнулась SOTA библиотека для генерации аудио AudioCraft v1.0.0

эйай ньюз

Релизнулась SOTA библиотека для генерации аудио AudioCraft v1.0.0

Я писал раньше о выходе начальной версии AudioCraft, когда Meta AI опубликовали статью MusicGen для генерации музыки по тексту.

Почему новый релиз интересен?
Это стабильный релиз и в него добавили код для трениновки моделей, в том числе несколько новых:

- EnCodec - по сути квантизованый автоэнкодер (VQGAN), который сжимает аудио в серию дискретных токенов.

- AudioGen - генерит по тексту повседневные звуки, типа лая собаки и прочих звуковых эффектов (кроме музыки).

- MusicGen - text2music и midi2musiс синтез. Есть модели от 300M до 3.3B параметров. На 16Gb влезут.

- MultiBandDiffusion - новый декодер, основанный на диффузии, который декодирует токены MusicGen в аудио дорожку. Лучше чем EnCodec.

(Ждите серию постов про каждую из этих моделей)

Еще добавлены веса AudioGen и MultiBandDiffusion.

🔥А теперь представьте, использование этих моделей при монтировании роликов для ютуба.

Блог
Код и веса
Демо в колабе
MusicGen ноутбук

@ai_newz

www.group-telegram.com/ye/ai_newz.com/2090

32.8K viewsedited Aug 3, 2023 at 13:56

group-telegram.com/ai_newz/2090

Create: 2023-08-03
Last Update: 2025-02-22 18:53:52

BY эйай ньюз

Share with your friend now:
group-telegram.com/ai_newz/2090

Telegram | DID YOU KNOW?

Релизнулась SOTA библиотека для генерации аудио AudioCraft v1.0.0