Telegram Group Search
Stable Flow: Vital Layers for Training-Free Image Editing

Редактирование изображений без обучения

Нежесткое редактирование, добавление объектов, удаление объектов и глобальное редактирование сцены

Жрет 80ГБ

Код

#imageediting
OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

ByteDance снова что-то анимируют

Оживлятор человеческих (и не только) портретов любой крупности (лицо, поясной, полный рост) и соотношения сторон. Анимирует как фото, так и рисунки.

На вход помимо собственно портрета нужен сигнал для извлечения движения: звук, видео или их комбинация

Выглядит круто,
Кода нет

#portraitanimation #audio2video #audio2motion #motion2video #talkinghead #lipsync
This media is not supported in your browser
VIEW IN TELEGRAM
Хорошие новости для недомузыкантов вроде меня

Генератор музыки YuE можно установить локально в пару кликов в Pinokio

Для работы достаточно 10Гб VRAM, только Nvidia

Умеет принимать ваше аудио на вход!

#text2music #music #audio2music #music2music
MatAnyone: Stable Video Matting with Consistent Memory Propagation

Создает маску на заданного человека на видео
На вход принимает маску в первом кадре. По потеть не придется, целевая маска создается в несколько кликов.

Пока еще далеко от идеала, но надеюсь станет подспорьем в композе

Код и демо ждем на следующей неделе

#segmentation #matting #video2matte #video2mask
Media is too big
VIEW IN TELEGRAM
Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation

Генератор глубины разрешением до 4К для видео. Но не для любого, нужны данные с лидара. У потребительских лидаров, таких как в айфоне, например, очень кислое разрешение, что-то вроде 256x192. Эти данные плюс RGB видео используются как промпт для генерации высококачественной карты глубины

Код
Демо
Код неофициальный
Пример результата на rerun.io покрутить

#rgbd #video2depth
Media is too big
VIEW IN TELEGRAM
DiffVSR: Enhancing Real-World Video Super-Resolution with Diffusion Models for Advanced Visual Quality and Temporal Consistency

Ну-ка, ну-ка
Еще один апскейлер для видео от китайцев, хвалится консистентностью, на черрипиках хорош

Препринт (Ссылка на сайте не работает)
Код ждем

#upscale #upscalevideo #enhance
MVGD: Zero-Shot Novel View and Depth Synthesis with Multi-View Geometric Diffusion

Диффузный генератор новых консистентных ракурсов с картой глубины заданной сцены. На вход - любое количество ракурсов сцены.

Код ждем

#image2depth #novelview
This media is not supported in your browser
VIEW IN TELEGRAM
Open Deep Research

Опенсорсный клон Deep Reserach вышел спустя 12 часов после презентации Open AI агента для исследований

Экономим $200 на подписке

#assistant #agent
This media is not supported in your browser
VIEW IN TELEGRAM
Срочные (нет) новости (нет)

Слышали про квадрат на Марсе?
Так вот, там целый датацентр уже построен и даже нанесен на гуглмапс с панорамами самим Гуглом 1 апреля 2017 года

#оффтоп #humor
2025/02/05 01:00:26
Back to Top
HTML Embed Code: