Telegram Group Search
SkyReels v2 Lora training

Вы знали что сервис skyreels позволяет обучать видеолоры? А также создавать по запросу целые монтажные сценарии и генерировать видео по ним

#text2movie #lora
This media is not supported in your browser
VIEW IN TELEGRAM
Kling LypSync обновился

Теперь поддерживает выбор персонажей
Есть настройка таймлинии
Сохранение оригинального звука
Длительность до 60 секунд

#lypsync #image2video #posrtraitanimation
This media is not supported in your browser
VIEW IN TELEGRAM
Kling Sound

А также выпустили генератор звуков для видео
Или просто по текстовому описанию

#video2sound #text2sound #sfx #foley
This media is not supported in your browser
VIEW IN TELEGRAM
3d-model-playground

Просто побаловаться с вебкой
Можно закинуть модельку и в реальном времени ее руками крутить и анимировать

#3d #realtime #webcam
Baidu выпустили в опенсорс семейство моделей ERNIE 4.5

#SOTA на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.

Опубликовано всего 23 модели ERNIE 4.5 от компактнойdense‑версии с 0.3B параметров до старшей модели с 424B параметров (#MoE)

Попробовать
Веса
Гитхаб
AI Studio

#assistant #reasoning #VLM
XVerse: Consistent Multi-Subject Control of Identity and Semantic Attributes via DiT Modulation

Генератор картинок по тексту от ByteDance

Позволяет точно управлять несколькими объектами в одном изображении.

Детальная настройка семантических атрибутов, таких как поза, стиль и освещение

Код
Веса 1.2Gb + 1.8Gb - и что сегодня можно выжать из таких весов?
Демо ждем

#text2image #subjectcontrol #multisubject
Ovis-U1

Мультимодальная модель от Alibaba для понимания, генерации и редактирования изображений

- Поддерживает понимание сложных визуальных сцен и текстового контента, ответы на вопросы об изображениях, выполнение визуальных ответов на вопросы (VQA) и генерацию описаний изображений.

- Генерирует высококачественные изображения на основе текстовых описаний, поддерживая различные стили и сложные изображения сцен.

- Точное редактирование изображений на основе текстовых инструкций, включая добавление, корректировку, замену или удаление элементов, а также перенос стиля.

Код
Веса
Демо

#vlm #text2image #imageediting #captioning #image2text
HeyGen Video Agent

Видеоролики под ключ
Под соусом "Креативная операционная система", "Будущее создания видеороликов"


Записаться в вейтлист

#agent #text2movie
2025/07/01 00:27:41
Back to Top
HTML Embed Code: