group-telegram.com/Psy_Eyes/2406
Last Update:
DeepSeek: сделали модель Janus Pro 7B, которая может и генерить картинки (не убийца Flux конечно) и чатиться по загруженным.
Flex.1 Alpha: Ostris сделал версию Flux на основе шнель с лицензией Apache. 8B параметров, можно гонять на видюхе.
SVFR: фреймворк для восстановления лиц на видео. Есть колоризация, инпейтинг, BFR.
Phygital+: улучшения в генерации 3D по картинке, поддержка лор на Flux.
PAR: параллелизация генераций без изменения архитектуры и токенайзера.
FitDit: новая виртуальная примерочная. Есть комфи.
DiffuEraser: сегментируем объекты на видео и удаляем их с учётом фона через инпейнт.
Google: дают пощупать Imagen 3, нужен IP на США.
Alibaba: по-тихому выпустили свой генератор видео в чате с Qwen. Примеры генераций.
Создание векторной бд с данными о видео записях, чтобы потом быстро находить нужный видос по кадру. Похоже на Marengo, только с CLI + Comfy.
Video Depth Anything: получаем карту глубины видео.
Shuttle Jaguar: генератор картинок с фокусом на эстетичных кадрах.
Hallo: выпустили V 3 аниматора портретов и датасет на хаггинге.
🎸 ЗВУК 🎸
YuE: новый опенсорсный генератор музыки. Пока песочно и дизгармонично (не конкурент Udio или Suno), но лучше MusicGen и любой движ в эту сторону уже хорошо. В принципе для инструменталок или семплов может сгодиться. Лицензия на днях сменилась на Apache, что позволяет коммерческое использование.
Suno: V4 стала доступна всем. Плюс треки в своей библиотеке теперь можно группировать в рабочие пространства (Workspaces). И появился AI-соавтор музыки для детальной работы с лирикой.
Riffusion: представили генератор музыки FUZZ. Звучит годно (не только на поп/рэп) и есть инструменты для контроля аудио. Небольшая предыстория проекта.
MMaudio: генератор аудио, анализирующий беззвучное видео и выдающий походящий звук. Крутилки в наличии.
Style TTS 2: давний генератор речи и клонер голоса, для которого появился установщик в Pinokio. Ещё есть демка.
Hailuo: сделали модель для работы с голосом T2A-01. Есть клонирование, генератор речи (TTS), и изоляция голоса. Крутилки присутствуют. В наличии HD версия для результатов в высоком качестве, и Turbo.
Kokoro: маленький, шустрый, и неплохой генератор речи, который можно гонять дома, а генерации использовать в коммерческих целях (Apache 2). Русского нет, но можно научить. Можно смешивать голоса в студии.. Гитхаб
BY Psy Eyes
Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260
Share with your friend now:
group-telegram.com/Psy_Eyes/2406