Telegram Group & Telegram Channel
Media is too big
VIEW IN TELEGRAM
А вот это уже серьёзно!

NUWA XL это мультимодальная генеративная модель для генерации длинных видео с хорошим качеством (1024x1024) за счет распараллеливания диффузией. Вы пишете промты к происходящему в сценах сценария, остальное нейронка делает сама. Сначала глобальной диффузией генерируются ключевые кадры для всего хронометража, а дальше локальной диффузией недостающие кадры в промежутках. На тестах генерация 1024 кадров заняла всего за 26 секунд вместо ~8 минут обычным рендером (меньше на 94%). При этом тренировать модель можно не на коротких видео, а на видосах длинной до 3376 фреймов (140 сек при 24 к/с), чтобы исключить пробелы на стадии трени и генерить все сегменты параллельно.

NUWA Infinity такая же модель, но для генерации высококачественных изображений и видео, используя на входе текст, картинку или видос. Подходит для аутпейтинга, анимации, text-2-image. Хорошо получаются панорамы, вплоть до 360°. В примере взяли на вход картину "Along the River During the Qingming Festival", сгенерировали на её основе очень длинное полотно с высокой детализацией, и через панорамирование + наложение музыки получили почти готовый фрагмент для анимации. Также можно оживлять одиночные кадры вроде моря или костра.

Панорамы, как и анимация, могут сгодиться для фона или композа в кадре. На крупный план пока генерациям рано, но всё это уже довольно близко к уровню продакшена.

Подход к написанию сценариев в ближайшее время может измениться. Описания между диалогами приблизятся к промтам, и будет больше упор на визуализацию, чем на нарратив ("Barney is saying something to Wilma in the room"). Нейронка будет считывать глобальный контекст (или он ей будет задаваться) и генерить видеоряд с предложением вариантов развития событий. Режиссёр выбирает варик и может контролировать происходящее в кадре промтом, залинкованным Cine Tracer, или другими инструментами. Если изменения затрагивают другие сцены, они перегенерятся и детали также можно править.

Сайт
Бумага NUWA XL
Бумага NUWA Infinity
Github (код Microsoft)



group-telegram.com/Psy_Eyes/535
Create:
Last Update:

А вот это уже серьёзно!

NUWA XL это мультимодальная генеративная модель для генерации длинных видео с хорошим качеством (1024x1024) за счет распараллеливания диффузией. Вы пишете промты к происходящему в сценах сценария, остальное нейронка делает сама. Сначала глобальной диффузией генерируются ключевые кадры для всего хронометража, а дальше локальной диффузией недостающие кадры в промежутках. На тестах генерация 1024 кадров заняла всего за 26 секунд вместо ~8 минут обычным рендером (меньше на 94%). При этом тренировать модель можно не на коротких видео, а на видосах длинной до 3376 фреймов (140 сек при 24 к/с), чтобы исключить пробелы на стадии трени и генерить все сегменты параллельно.

NUWA Infinity такая же модель, но для генерации высококачественных изображений и видео, используя на входе текст, картинку или видос. Подходит для аутпейтинга, анимации, text-2-image. Хорошо получаются панорамы, вплоть до 360°. В примере взяли на вход картину "Along the River During the Qingming Festival", сгенерировали на её основе очень длинное полотно с высокой детализацией, и через панорамирование + наложение музыки получили почти готовый фрагмент для анимации. Также можно оживлять одиночные кадры вроде моря или костра.

Панорамы, как и анимация, могут сгодиться для фона или композа в кадре. На крупный план пока генерациям рано, но всё это уже довольно близко к уровню продакшена.

Подход к написанию сценариев в ближайшее время может измениться. Описания между диалогами приблизятся к промтам, и будет больше упор на визуализацию, чем на нарратив ("Barney is saying something to Wilma in the room"). Нейронка будет считывать глобальный контекст (или он ей будет задаваться) и генерить видеоряд с предложением вариантов развития событий. Режиссёр выбирает варик и может контролировать происходящее в кадре промтом, залинкованным Cine Tracer, или другими инструментами. Если изменения затрагивают другие сцены, они перегенерятся и детали также можно править.

Сайт
Бумага NUWA XL
Бумага NUWA Infinity
Github (код Microsoft)

BY Psy Eyes


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/Psy_Eyes/535

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

"There are a lot of things that Telegram could have been doing this whole time. And they know exactly what they are and they've chosen not to do them. That's why I don't trust them," she said. Founder Pavel Durov says tech is meant to set you free But Telegram says people want to keep their chat history when they get a new phone, and they like having a data backup that will sync their chats across multiple devices. And that is why they let people choose whether they want their messages to be encrypted or not. When not turned on, though, chats are stored on Telegram's services, which are scattered throughout the world. But it has "disclosed 0 bytes of user data to third parties, including governments," Telegram states on its website. Following this, Sebi, in an order passed in January 2022, established that the administrators of a Telegram channel having a large subscriber base enticed the subscribers to act upon recommendations that were circulated by those administrators on the channel, leading to significant price and volume impact in various scrips. Again, in contrast to Facebook, Google and Twitter, Telegram's founder Pavel Durov runs his company in relative secrecy from Dubai.
from us


Telegram Psy Eyes
FROM American