Telegram Group & Telegram Channel
⚡️ Китай наносит новый удар. 🔥

ByteDance выпустила OmniHuman-1, модель для создания реалистичных видео на основе одного изображения.

OmniHuman
-1 - работает на основе диффузионного преобразования, которая генерирует высокореалистичные видео на основе изображения и аудио/видео.

В модели реализовано обучение с учетом всех условий окружения, что позволяет масштабировать генерацию, создавать связанные с движением и значительно повысить реалистичность жестов и движений тела.

В отличие от предыдущих моделей, ограниченных лицевой или статичной анимацией тела, OmniHuman-1 поддерживает различные соотношения сторон, сложные взаимодействия человека и объектов вокруг.

Она превосходит существующие методы по реалистичности, достигая высокой точности синхронизации губ, точности жестов и выразительности лица.


→ Модель построена на архитектуре DiT (Diffusion Transformer), поддерживает мультимодальность.

→ Превосходит конкурентов (например, Loopy, CyberHost, DiffTED) по точности синхронизации губ (5,255 против 4,814), FVD (15,906 против 16,134) и выразительности жестов, при этом поддерживая различные пропорции тела в одной модели.

https://huggingface.co/papers/2502.01061

@data_analysis_ml



group-telegram.com/data_analysis_ml/3151
Create:
Last Update:

⚡️ Китай наносит новый удар. 🔥

ByteDance выпустила OmniHuman-1, модель для создания реалистичных видео на основе одного изображения.

OmniHuman
-1 - работает на основе диффузионного преобразования, которая генерирует высокореалистичные видео на основе изображения и аудио/видео.

В модели реализовано обучение с учетом всех условий окружения, что позволяет масштабировать генерацию, создавать связанные с движением и значительно повысить реалистичность жестов и движений тела.

В отличие от предыдущих моделей, ограниченных лицевой или статичной анимацией тела, OmniHuman-1 поддерживает различные соотношения сторон, сложные взаимодействия человека и объектов вокруг.

Она превосходит существующие методы по реалистичности, достигая высокой точности синхронизации губ, точности жестов и выразительности лица.


→ Модель построена на архитектуре DiT (Diffusion Transformer), поддерживает мультимодальность.

→ Превосходит конкурентов (например, Loopy, CyberHost, DiffTED) по точности синхронизации губ (5,255 против 4,814), FVD (15,906 против 16,134) и выразительности жестов, при этом поддерживая различные пропорции тела в одной модели.

https://huggingface.co/papers/2502.01061

@data_analysis_ml

BY Анализ данных (Data analysis)


Share with your friend now:
group-telegram.com/data_analysis_ml/3151

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Recently, Durav wrote on his Telegram channel that users' right to privacy, in light of the war in Ukraine, is "sacred, now more than ever." Oleksandra Matviichuk, a Kyiv-based lawyer and head of the Center for Civil Liberties, called Durov’s position "very weak," and urged concrete improvements. Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress. "The argument from Telegram is, 'You should trust us because we tell you that we're trustworthy,'" Maréchal said. "It's really in the eye of the beholder whether that's something you want to buy into." Emerson Brooking, a disinformation expert at the Atlantic Council's Digital Forensic Research Lab, said: "Back in the Wild West period of content moderation, like 2014 or 2015, maybe they could have gotten away with it, but it stands in marked contrast with how other companies run themselves today."
from us


Telegram Анализ данных (Data analysis)
FROM American