Media is too big
VIEW IN TELEGRAM
YuE: Open Music Foundation Models for Full-Song Generation
Заявка на конкуренцию Suno в опенсорсе - китайский генератор песен.
Русского языка пока нет, есть английский, китайский, японский и корейский.
Влезает в 24ГБ VRAM
Код
Видеотуториал
#text2music #music
Заявка на конкуренцию Suno в опенсорсе - китайский генератор песен.
Русского языка пока нет, есть английский, китайский, японский и корейский.
Влезает в 24ГБ VRAM
Код
Видеотуториал
#text2music #music
This media is not supported in your browser
VIEW IN TELEGRAM
В 3D генератор Hunyuan3D-2 завезли приблуду для Блендера
Инструкция на гитхабе
#textto3d #imageto3d #blender
Инструкция на гитхабе
#textto3d #imageto3d #blender
This media is not supported in your browser
VIEW IN TELEGRAM
Riffusion FUZZ
Новая модель для генерации музыки на сервисе Riffusion
Интересная фишка - персонализация. По мере накопления ваших генераций сервис запоминает ваши предпочтения и подстраивается под вас
Умеет песни и инструментал
Есть свой генератор текстов Ghostwriter
Умеет делать музыку из вашего образца
Есть функция Remix - переработка чужой или своей генерации
На время бетатестирования все бесплатно
Демо - не знаю зачем, но здесь будет демоспейс
#text2music #music2music #audio2music
Новая модель для генерации музыки на сервисе Riffusion
Интересная фишка - персонализация. По мере накопления ваших генераций сервис запоминает ваши предпочтения и подстраивается под вас
Умеет песни и инструментал
Есть свой генератор текстов Ghostwriter
Умеет делать музыку из вашего образца
Есть функция Remix - переработка чужой или своей генерации
На время бетатестирования все бесплатно
Демо - не знаю зачем, но здесь будет демоспейс
#text2music #music2music #audio2music
This media is not supported in your browser
VIEW IN TELEGRAM
NVIDIA Broadcast 2.0.0
День звука на канале продолжается
Обновилась утилита рилтаймовой обработки звука и видео
По звуку:
удаляет эхо, посторонний шум, оставляя голос. наверчивает ИИ-эквалазер, приближая говномикрофоны к студийному качеству
По видео: направляет зрачки в камеру, блюрит фон, заменяет фон, удаляет шум. Релайтинг лица - подсвечивает лицо виртуальным источником.
#realtime #streaming #denoise #audioenhance #eyecontact #bgreplacement #bg #relighting #deecho
День звука на канале продолжается
Обновилась утилита рилтаймовой обработки звука и видео
По звуку:
удаляет эхо, посторонний шум, оставляя голос. наверчивает ИИ-эквалазер, приближая говномикрофоны к студийному качеству
По видео: направляет зрачки в камеру, блюрит фон, заменяет фон, удаляет шум. Релайтинг лица - подсвечивает лицо виртуальным источником.
#realtime #streaming #denoise #audioenhance #eyecontact #bgreplacement #bg #relighting #deecho
This media is not supported in your browser
VIEW IN TELEGRAM
Luma апскейл 4K
Недавно всем выдали доступ к своей модели Ray 2
А теперь вот представили видеоапскейлер для генераций
Ну и не стоит ждать от него чудес
#upscale
Недавно всем выдали доступ к своей модели Ray 2
А теперь вот представили видеоапскейлер для генераций
Ну и не стоит ждать от него чудес
#upscale
o3-mini для всех
Open AI таки выдали всем свою рассуждающую модель o3-mini
По лимитам для бесплатников непонятно
Пользуемся
#news
Open AI таки выдали всем свою рассуждающую модель o3-mini
По лимитам для бесплатников непонятно
Пользуемся
#news
Openai
OpenAI o3-mini
Pushing the frontier of cost-effective reasoning.
Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement
День звука продолжается
Клонировщик-генератор голоса с контролем эмоций и тембра
Есть 4 модели
- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.
Примеры по ссылке в заголовке
Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать
Код
#voicecloning #speech2speech #tts #text2speech
День звука продолжается
Клонировщик-генератор голоса с контролем эмоций и тембра
Есть 4 модели
- Vevo-Timbre: преобразование голоса с сохранением стиля.
- Vevo-Style: преобразование стиля, например преобразование акцента и эмоций.
- Vevo-Voice: преобразование голоса с учетом стиля.
- Vevo-TTS: генерация речи по тексту с регулируемым стилем и тембром.
Примеры по ссылке в заголовке
Обучен на шести языках - английский, китайский, немецкий, французский, японский и корейский
Так что на русский пока не стоит рассчитывать
Код
#voicecloning #speech2speech #tts #text2speech
GitHub
Amphion/models/vc/vevo at main · open-mmlab/Amphion
Amphion (/æmˈfaɪən/) is a toolkit for Audio, Music, and Speech Generation. Its purpose is to support reproducible research and help junior researchers and engineers get started in the field of audi...
Нейросети упрощают работу в 2 раза
Оказывается, ИИ можно внедрить в архитектуру и делать крутые результаты не засиживая по 5 часов у экрана
К примеру, объект на картинке я улучшил за 15 минут без особых усилий. А больше об этом читай здесь: https://www.group-telegram.com/+bfqBVy_lG9k2MTUy
#промо
Оказывается, ИИ можно внедрить в архитектуру и делать крутые результаты не засиживая по 5 часов у экрана
К примеру, объект на картинке я улучшил за 15 минут без особых усилий. А больше об этом читай здесь: https://www.group-telegram.com/+bfqBVy_lG9k2MTUy
#промо
This media is not supported in your browser
VIEW IN TELEGRAM
Inference Providers
HuggingFace запустил Inference Providers - бессерверный запуск моделей.
Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.
Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF
Бесплатным пользователям отсыпают немножко токенов в день
#news
HuggingFace запустил Inference Providers - бессерверный запуск моделей.
Теперь не надо никуда ходить чтобы потестить интересную модель, даже на Spaces.
Обеспечивают этот праздник партнеры - fal, Replicate, Sambanova, Together AI. Можете в аккаунте указать их API ключи если у вас есть. А можете и не указывать, тогда инференс будет на мощностях HF
Бесплатным пользователям отсыпают немножко токенов в день
#news
Stable Flow: Vital Layers for Training-Free Image Editing
Редактирование изображений без обучения
Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены
Жрет 80ГБ
Код
#imageediting
Редактирование изображений без обучения
Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены
Жрет 80ГБ
Код
#imageediting