VideoLifter: Lifting Videos to 3D with Fast Hierarchical Stereo Alignment
Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно
Код ждем
#gaussian #videoto3d #video2gaussian
Реконструкция 3D сцен по длинным видео.
Разбивает видео на фрагменты, чем еще отличается от 3DGS непонятно
Код ждем
#gaussian #videoto3d #video2gaussian
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
TransPixar: Advancing Text-to-Video Generation with Transparency
Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.
Генерация по тексту и по картинке
Прикрутили к CogvideoX и mochi
Код
Демо
#text2video #image2video #RGBA
Adobe придумали метод генерации видео с альфа каналом. Для тех кто не в курсе - это маска прозрачности.
Генерация по тексту и по картинке
Прикрутили к CogvideoX и mochi
Код
Демо
#text2video #image2video #RGBA
SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
Media is too big
VIEW IN TELEGRAM
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
Нейронавт | Нейросети в творчестве
ebook2audiobook v2.0.0 Beta Конвертер электронных книг в аудиокниги обновился. Поддерживает разные форматы, клонирование голоса, 1124 языка, в том числе русский. Но мне не понравилась голосовая модель, попозже покажу лучший вариант Демо #text2speech …
Please open Telegram to view this post
VIEW IN TELEGRAM
ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
ComfyUI-TangoFlux
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
GitHub
GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…
ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...