blacktraced Telegram Group

Veo3: Настолько ли всё круто?

Ну что, насмотревшись до тошноты сгенерированных "Street interview" на Veo3, пора и со своей колокольни написать о том, что удалось накопать и увидеть самому. Сам пока не пользовался, так как жаба душит, Google предлагает 2 плана на выбор:

🟠Google AI Pro за $19.99/мес, за который Вам насыпят всего лишь 1000 кредитсов, которых хватит всего на 10 генераций (одна генерация Veo3 стоит 100 кредитсов да). Если Вы активно работаете с видео, то понимаете, что этого едва хватит на побаловаться;

🟠Google AI Ultra за $249.99/мес на 12,500 кредитсов, это конечно лучше, но всё-равно сомнительно, плюс различные плюхи и только на этом плане доступна функция "Ingredients" — возможность закинуть в промпт картинки различных элементов и Veo3 это всё попытается объединить в сцену на основе Вашего запроса.

Кино в один клик?
Нет. Генерируются видео по классике отдельными кусочками до 8 секунд, но есть таймлайн, на который Вы можете закинуть сгенерированные сцены и там уже как в классическом редакторе их расставлять, подрезать и удлинять, догенерировав доп тайминг (смотрите официальную демонстрацию). Ну, давайте чётко по плюсам и минусам.

Плюсы:
🟠Классная реалистичная анимация и физика;
🟠Мимика (липсинк) в динамике выглядит убедительно и достаточно качественно, голоса звучат естественно;
🟠Отмечают прекрасное понимание промптов, прописывайте детали максимально по всему, что и как должно быть и происходить в сцене, "простым" понятным языком. Советуют юзать ChatGPT как промпт-инженера для огромных детальных промптов, с последующим редактированием вручную, как Вам необходимо;
🟠Саунд дизайн и диалоги на месте (главное не забыть переключиться именно на Veo3), всё прописывается в одном промпте с указанием какой персонаж что говорит, каким тоном и с каким настроением. То же самое со звуком. Вот тут есть небольшой базовый гайд, но советую посмотреть примеры и промпты к ним на странице DeepMind (листайте чуть ниже до примеров) и конкретные примеры у этого чувака в Твиттере;
🟠Помимо английского языка, русский язык и речь получаются отлично, чуваки проверили, насчёт других языков — вопрос;
🟠Хорошо держит эстетику из генерации в генерацию, если достаточно подробно всё расписать.

Минусы:
🟠Цена и лимиты;
🟠Мазнявость деталей никуда не делась и мыльное качество даже на апскейле 1080p;
🟠Анимация хоть и годная, но всё-равно в движениях присутствует вот эта странная синтетическая "эластичность";
🟠Консистентность персонажей довольно большая проблема для разных сцен, но таки можно сохранить консистентность, если генерить сцены на таймлайне как монтаж, советую почитать вот этот гайд для этого;
🟠"Ingredients" даёт достаточно слабые результаты, лучше пользоваться пока что text-to-video;
🟠Пресеты для управления камерой есть, но лучше прописывать движение и позицию камеры самим в промпте;
🟠Veo3 не поддерживает функцию ключевых кадров (оно же image-to-video), Вас автоматически переключит на модель Veo2;
🟠Разумеется, главный минус, что не в каждой стране оно доступно и тут только искать или покупать лыжи для окольных путей.

В общем, инструмент достаточно перспективный, но пока очень сырой и очень дорогой. Несколько примеров прикрепил к посту. Есть свои примеры — кидайте в комменты.

Кто дочитал этот пост до конца, вот Вам небольшой бонус. Тут чувак закинул видео, как можно получить себе студенческую безлимитную подписку на Google AI Pro аж на 15 месяцев бесплатно (но всё-равно нужна банковская карта США). Комменты разные, у кого-то получилось, у кого-то нет. Попробуйте, мало ли.

😳

BLACKTRACED

Please open Telegram to view this post