SPAR3D: Stable Point-Aware Reconstruction of 3D Objects from Single Images
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
Новинка от Stability AI
Быстрая реконструкция 3D модели по одному изображению с промежуточной генерацией облака точек.
На основе SF3D
Позволяет интерактивно редактировать модель
Код
Демо
#imageto3d #image2mesh
Media is too big
VIEW IN TELEGRAM
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
Апскейлер видео от ByteDance
Они там придумали как апскейлить видео при помощи видеогенераторов, сохраняя консистентность во времени.
Основано на I2VGen-XL, VEnhancer, CogVideoX и OpenVid-1M
Прикручено к I2VGen-XL и CogVideoX-5B
Претрейн на CogVideX-5B поддерживает исходники только 720x480
Иyфу по потреблению VRAM не нашел
Код
Демо
#upscale #enhance #video2video
Нейронавт | Нейросети в творчестве
ebook2audiobook v2.0.0 Beta Конвертер электронных книг в аудиокниги обновился. Поддерживает разные форматы, клонирование голоса, 1124 языка, в том числе русский. Но мне не понравилась голосовая модель, попозже покажу лучший вариант Демо #text2speech …
Please open Telegram to view this post
VIEW IN TELEGRAM
ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
Оценка позы по изображению и по видео
Код
Веса
Демо по картинке
Демо по видео/картинке
Колаб
#poseestimation #image2pose #video2pose
ComfyUI-TangoFlux
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
Для желающих заморочиться по генерации звуковых эффектов подвезли #ComfyUI ноды TangoFlux
#text2audio #text2sfx #foley
GitHub
GitHub - LucipherDev/ComfyUI-TangoFlux: ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with…
ComfyUI Custom Nodes for "TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching". This generates high-quality 44.1kHz audio up to 30 seconds using just a ...
This media is not supported in your browser
VIEW IN TELEGRAM
Hallo3: Highly Dynamic and Realistic Portrait Image Animation with Diffusion Transformer Networks
Новое поколение липсинка от Baidu
Работает и с головными уборами.
Анимирует не только лицо но и фон.
Все потому что внутри претрейн Cogvideox-5b-i2v
Код
Веса
#lipsync #talkinghead #humananimation #portraitanimation
Новое поколение липсинка от Baidu
Работает и с головными уборами.
Анимирует не только лицо но и фон.
Все потому что внутри претрейн Cogvideox-5b-i2v
Код
Веса
#lipsync #talkinghead #humananimation #portraitanimation
This media is not supported in your browser
VIEW IN TELEGRAM
EditAR: Unified Conditional Generation with Autoregressive Models
Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA
- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске
Код ждем
#imageediting #conditioning #controlnet
Авторегрессионная модель для различных задач управляемой генерации картинок от NVIDIA
- редактирование изображений
- генерация картинки по карте глубины
- генерация по карте краев (canny/edges)
- генерация по сегментной маске
Код ждем
#imageediting #conditioning #controlnet
FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on
Виртуальная примерочная от Tencent
Код
Демо HF
Демо 2
#tryon
Виртуальная примерочная от Tencent
Код
Демо HF
Демо 2
#tryon
Consistent Flow Distillation for Text-to-3D Generation
Генерация 3D-моделей с использованием предварительно обученного генератора картинок с мультиракурсно согласованным гауссовым шумом
Код
#textto3d
Генерация 3D-моделей с использованием предварительно обученного генератора картинок с мультиракурсно согласованным гауссовым шумом
Код
#textto3d
This media is not supported in your browser
VIEW IN TELEGRAM
Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation
Реконструкция 3D объектов в экстремальных условиях освещения
Проект Гугла, кода нет
#relighting #nerf #3Dreconstruction #photogrammetry
Реконструкция 3D объектов в экстремальных условиях освещения
Проект Гугла, кода нет
#relighting #nerf #3Dreconstruction #photogrammetry
This media is not supported in your browser
VIEW IN TELEGRAM
Fast Music Remover
Удаление фонового шума с аудиозаписи
Код
#noisereduction #audio2audio #audio2stem #audioseparation #voiceisolation
Удаление фонового шума с аудиозаписи
Код
#noisereduction #audio2audio #audio2stem #audioseparation #voiceisolation