Telegram Group Search
Video World Models with Long-term Spatial Memory

Видеогенератор использует долгосрочную пространственную память для улучшения качества и согласованности генерируемых видео

Кода нет зато похоже на RDR2

#image2video
HuggingFace запустили #MCP сервер, предлагают подключать свои LLM к API-интерфейсам Hub напрямую из Cursor, VSCode, Windsurf и других приложений MCP

#news
This media is not supported in your browser
VIEW IN TELEGRAM
MARBLE: Material Recomposition and Blending in CLIP-Space

Новинка от Stability AI

Метод редактирования и смешивания материалов в изображениях с помощью предварительно обученных генеративных моделей, управляя ими через изменения в пространстве эмбеддингоав CLIP. Это позволяет настраивать такие свойства материалов, как шероховатость, металлический вид, прозрачность и свечение.

Код
Демо

#material #imageediting
На fal.ai завезли Veo 3 от Гугла. Об этом в соответствующем анонсе объявила сама площадка в своем дискорде.

Никаких пробных попыток не дают, генерация 5-ти секундного видео стоит $3.75.

Спасибо @asleephidden

#text2video

https://fal.ai/models/fal-ai/veo3/playground
Media is too big
VIEW IN TELEGRAM
SeedVR2: One-Step Video Restoration via Diffusion Adversarial Post-Training

Метод одношаговой реставрации видео с помощью диффузии

Код ждем

#videorestoration
Media is too big
VIEW IN TELEGRAM
FlexPainter: Flexible and Multi-View Consistent Texture Generation

Гибкая генерация текстур, согласованных по ракурсам

На вход принимает референсные картинки и текстовые описания

Код ждем

#texture #image2texture
Pixel3DMM: Versatile Screen-Space Priors for Single-Image 3D Face Reconstruction

Создание 3D-модели лица по одной фотографии. Модель анализирует изображение и предсказывает геометрические характеристики для каждой точки изображения, что позволяет точно реконструировать форму лица в трёх измерениях.

Но выходе можно получить:

- нормали

- uv-координаты

- 2D-вершины (точки на плоскости, которые помогают в реконструкции геометрии лица)

- параметры 3D морфабельной модели лица (3DMM), которые описывают форму и особенности лица в трёх измерениях

Код

#imageto3d #head #image2normal #image2uv #uv
SkyReels-Audio: Omni Audio-Conditioned Talking Portraits in Video Diffusion Transformers

Оживлятор портретов по аудиофайлу речи от SkyReels

Умеет делать липсинк видео

Похоже что код и веса публиковать не собираются

Платно на офсайте - Можно загрузить свое аудио или сгенерировать, на выбор есть библиотека голосов

#lipsync #portraitanimation #speech2video #image2video
Media is too big
VIEW IN TELEGRAM
Difix3D+: Improving 3D Reconstructions with Single-Step Diffusion Models

Исправляет артефакты NeRF и 3DGS в областях с недостатком констрейнов (??), повышая общее качество 3D-представления. Проект NVIDIA

Код ждем

#gaussian #nerf
Media is too big
VIEW IN TELEGRAM
CAST: Component-Aligned 3D Scene Reconstruction from an RGB Image

Cоздает 3D модели по одной картинке с учётом физических взаимодействий и пространственных отношений объектов

В деле замешаны Deemos

Код ждем

#imageto3d #image2scene
Media is too big
VIEW IN TELEGRAM
TeGA: Texture Space Gaussian Avatars for High-Resolution DynamicHead Modeling

Аватары на гауссианах от Google
Впечатляющее качество, уделали всех конкурентов, но

Кода нет

#gaussian #humanavatar
HeyGem

Опенсорсная альтернатива HeyGen. Ну можно было и по названию догадаться

- Аватар в 4K по отрывку видео 1 секунда (???)
- Клонирование лица и голоса
- Запускается на 1080Ti +

Код

#lipsync #humanavatar #vocecloning #avatar #
Опубликован код и веса видеореставратора SeedVR2

Одна H100-80G может обрабатывать видео с разрешением 100x720x1280. 4 штуки H100-80G - дополнительно поддерживают видео 1080p и 2K.

Но обещают в будущем Tile-VAE и Progressive Aggregation Sampling

Код
Веса

#videorestoration
2025/06/15 22:07:08
Back to Top
HTML Embed Code: