Telegram Group & Telegram Channel
Media is too big
VIEW IN TELEGRAM
А вот это уже серьёзно!

NUWA XL это мультимодальная генеративная модель для генерации длинных видео с хорошим качеством (1024x1024) за счет распараллеливания диффузией. Вы пишете промты к происходящему в сценах сценария, остальное нейронка делает сама. Сначала глобальной диффузией генерируются ключевые кадры для всего хронометража, а дальше локальной диффузией недостающие кадры в промежутках. На тестах генерация 1024 кадров заняла всего за 26 секунд вместо ~8 минут обычным рендером (меньше на 94%). При этом тренировать модель можно не на коротких видео, а на видосах длинной до 3376 фреймов (140 сек при 24 к/с), чтобы исключить пробелы на стадии трени и генерить все сегменты параллельно.

NUWA Infinity такая же модель, но для генерации высококачественных изображений и видео, используя на входе текст, картинку или видос. Подходит для аутпейтинга, анимации, text-2-image. Хорошо получаются панорамы, вплоть до 360°. В примере взяли на вход картину "Along the River During the Qingming Festival", сгенерировали на её основе очень длинное полотно с высокой детализацией, и через панорамирование + наложение музыки получили почти готовый фрагмент для анимации. Также можно оживлять одиночные кадры вроде моря или костра.

Панорамы, как и анимация, могут сгодиться для фона или композа в кадре. На крупный план пока генерациям рано, но всё это уже довольно близко к уровню продакшена.

Подход к написанию сценариев в ближайшее время может измениться. Описания между диалогами приблизятся к промтам, и будет больше упор на визуализацию, чем на нарратив ("Barney is saying something to Wilma in the room"). Нейронка будет считывать глобальный контекст (или он ей будет задаваться) и генерить видеоряд с предложением вариантов развития событий. Режиссёр выбирает варик и может контролировать происходящее в кадре промтом, залинкованным Cine Tracer, или другими инструментами. Если изменения затрагивают другие сцены, они перегенерятся и детали также можно править.

Сайт
Бумага NUWA XL
Бумага NUWA Infinity
Github (код Microsoft)



group-telegram.com/Psy_Eyes/535
Create:
Last Update:

А вот это уже серьёзно!

NUWA XL это мультимодальная генеративная модель для генерации длинных видео с хорошим качеством (1024x1024) за счет распараллеливания диффузией. Вы пишете промты к происходящему в сценах сценария, остальное нейронка делает сама. Сначала глобальной диффузией генерируются ключевые кадры для всего хронометража, а дальше локальной диффузией недостающие кадры в промежутках. На тестах генерация 1024 кадров заняла всего за 26 секунд вместо ~8 минут обычным рендером (меньше на 94%). При этом тренировать модель можно не на коротких видео, а на видосах длинной до 3376 фреймов (140 сек при 24 к/с), чтобы исключить пробелы на стадии трени и генерить все сегменты параллельно.

NUWA Infinity такая же модель, но для генерации высококачественных изображений и видео, используя на входе текст, картинку или видос. Подходит для аутпейтинга, анимации, text-2-image. Хорошо получаются панорамы, вплоть до 360°. В примере взяли на вход картину "Along the River During the Qingming Festival", сгенерировали на её основе очень длинное полотно с высокой детализацией, и через панорамирование + наложение музыки получили почти готовый фрагмент для анимации. Также можно оживлять одиночные кадры вроде моря или костра.

Панорамы, как и анимация, могут сгодиться для фона или композа в кадре. На крупный план пока генерациям рано, но всё это уже довольно близко к уровню продакшена.

Подход к написанию сценариев в ближайшее время может измениться. Описания между диалогами приблизятся к промтам, и будет больше упор на визуализацию, чем на нарратив ("Barney is saying something to Wilma in the room"). Нейронка будет считывать глобальный контекст (или он ей будет задаваться) и генерить видеоряд с предложением вариантов развития событий. Режиссёр выбирает варик и может контролировать происходящее в кадре промтом, залинкованным Cine Tracer, или другими инструментами. Если изменения затрагивают другие сцены, они перегенерятся и детали также можно править.

Сайт
Бумага NUWA XL
Бумага NUWA Infinity
Github (код Microsoft)

BY Psy Eyes


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/Psy_Eyes/535

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In 2018, Russia banned Telegram although it reversed the prohibition two years later. "He has kind of an old-school cyber-libertarian world view where technology is there to set you free," Maréchal said. Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK. Unlike Silicon Valley giants such as Facebook and Twitter, which run very public anti-disinformation programs, Brooking said: "Telegram is famously lax or absent in its content moderation policy." In addition, Telegram's architecture limits the ability to slow the spread of false information: the lack of a central public feed, and the fact that comments are easily disabled in channels, reduce the space for public pushback.
from in


Telegram Psy Eyes
FROM American