SkyReels v2 Lora training
Вы знали что сервис skyreels позволяет обучать видеолоры? А также создавать по запросу целые монтажные сценарии и генерировать видео по ним
#text2movie #lora
Вы знали что сервис skyreels позволяет обучать видеолоры? А также создавать по запросу целые монтажные сценарии и генерировать видео по ним
#text2movie #lora
This media is not supported in your browser
VIEW IN TELEGRAM
Kling LypSync обновился
Теперь поддерживает выбор персонажей
Есть настройка таймлинии
Сохранение оригинального звука
Длительность до 60 секунд
#lypsync #image2video #posrtraitanimation
Теперь поддерживает выбор персонажей
Есть настройка таймлинии
Сохранение оригинального звука
Длительность до 60 секунд
#lypsync #image2video #posrtraitanimation
This media is not supported in your browser
VIEW IN TELEGRAM
Kling Sound
А также выпустили генератор звуков для видео
Или просто по текстовому описанию
#video2sound #text2sound #sfx #foley
А также выпустили генератор звуков для видео
Или просто по текстовому описанию
#video2sound #text2sound #sfx #foley
This media is not supported in your browser
VIEW IN TELEGRAM
3d-model-playground
Просто побаловаться с вебкой
Можно закинуть модельку и в реальном времени ее руками крутить и анимировать
#3d #realtime #webcam
Просто побаловаться с вебкой
Можно закинуть модельку и в реальном времени ее руками крутить и анимировать
#3d #realtime #webcam
Baidu выпустили в опенсорс семейство моделей ERNIE 4.5
#SOTA на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.
Опубликовано всего 23 модели ERNIE 4.5 от компактнойdense‑версии с 0.3B параметров до старшей модели с 424B параметров (#MoE)
Попробовать
Веса
Гитхаб
AI Studio
#assistant #reasoning #VLM
#SOTA на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.
Опубликовано всего 23 модели ERNIE 4.5 от компактнойdense‑версии с 0.3B параметров до старшей модели с 424B параметров (#MoE)
Попробовать
Веса
Гитхаб
AI Studio
#assistant #reasoning #VLM
XVerse: Consistent Multi-Subject Control of Identity and Semantic Attributes via DiT Modulation
Генератор картинок по тексту от ByteDance
Позволяет точно управлять несколькими объектами в одном изображении.
Детальная настройка семантических атрибутов, таких как поза, стиль и освещение
Код
Веса 1.2Gb + 1.8Gb - и что сегодня можно выжать из таких весов?
Демо ждем
#text2image #subjectcontrol #multisubject
Генератор картинок по тексту от ByteDance
Позволяет точно управлять несколькими объектами в одном изображении.
Детальная настройка семантических атрибутов, таких как поза, стиль и освещение
Код
Веса 1.2Gb + 1.8Gb - и что сегодня можно выжать из таких весов?
Демо ждем
#text2image #subjectcontrol #multisubject
Ovis-U1
Мультимодальная модель от Alibaba для понимания, генерации и редактирования изображений
- Поддерживает понимание сложных визуальных сцен и текстового контента, ответы на вопросы об изображениях, выполнение визуальных ответов на вопросы (VQA) и генерацию описаний изображений.
- Генерирует высококачественные изображения на основе текстовых описаний, поддерживая различные стили и сложные изображения сцен.
- Точное редактирование изображений на основе текстовых инструкций, включая добавление, корректировку, замену или удаление элементов, а также перенос стиля.
Код
Веса
Демо
#vlm #text2image #imageediting #captioning #image2text
Мультимодальная модель от Alibaba для понимания, генерации и редактирования изображений
- Поддерживает понимание сложных визуальных сцен и текстового контента, ответы на вопросы об изображениях, выполнение визуальных ответов на вопросы (VQA) и генерацию описаний изображений.
- Генерирует высококачественные изображения на основе текстовых описаний, поддерживая различные стили и сложные изображения сцен.
- Точное редактирование изображений на основе текстовых инструкций, включая добавление, корректировку, замену или удаление элементов, а также перенос стиля.
Код
Веса
Демо
#vlm #text2image #imageediting #captioning #image2text
HeyGen Video Agent
Видеоролики под ключ
Под соусом "Креативная операционная система", "Будущее создания видеороликов"
Записаться в вейтлист
#agent #text2movie
Видеоролики под ключ
Под соусом "Креативная операционная система", "Будущее создания видеороликов"
Записаться в вейтлист
#agent #text2movie