Telegram Group Search
Forwarded from TechSparks
А вот это просто изящно:)
В генераторе картинок и видео Sora есть галерея текущих генераций, именно в ней зарождаются тренды, который начинают вирусить, как только их подхватывает сообщество авторов. Так было недавно с гиблификацией и с фигурками в коробочках, которые напоминают автора.
Но вот новый тренд: генерить картинки, которые содержат текст, обращенный к разработчика Sora с пожеланиями о доработках или функционале. Этакая публичная обратная связь от пользователей, выдержанная в формате самого продукта. Впечатляет!

https://www.techradar.com/computing/artificial-intelligence/the-hottest-new-ai-image-trend-is-sora-users-begging-for-new-features-using-its-built-in-image-generation-features-and-im-here-for-it
Нашел полезное.

Регулярно обновляемый каталог, в котором собрано более 68 000 GPT-приложений и более 1 100 плагинов.

Называется Plugin Surf.

Внутри реализован поиск по категориям (финансы, разработка, образование, маркетинг и т.д).​

#LLM@TochkiNadAI
This media is not supported in your browser
VIEW IN TELEGRAM
Разбираем пайплайн. Как сделали это видео.

1. Объемный захват в spatial-студии Kartel.ai
2. Создаем окружение с помощью Gaussian Splatting от World Labs
3. Собираем все в WebGL-вьюер
4. Генерация в ComfyUI, с Wan Fun Control
5. Используем две LoRA-модели:
– Первая генерирует стартовый кадр через Flux
– Вторая направляет генерацию Wan 2.1, чтобы сохранить персонажа и позу

На выходе — консистентный, реалистичный персонаж в синтетической 3D-сцене.
Не так уж часто у нас тут с вами AI-арт для вдохновения.
Только перед сном не смотрите.

Сегодня не пятница тринадцатое, но я все равно поделюсь с вами двумя любимыми дарксайд ИИ-примерами работ видео-художников.

Для слабонервных чуть позже сделаю подборку любимых мягеньких визуалов, а пока пополним копилку двумя стильными creepy-аккаунтами. Это мои любимки в этом жанре.

solarw.ai – крутейший стиль, сочетающий хтонический сюрреализм постсоветских уездов, как будто Гаспар Ноэ воскресил Балабанова, дал ему безлимитный доступ в Kling и Flux, и начал нашептывать странные вещи на ухо.

MACBETH – безысходность лиминальных пространств, перекрученная через мясорубку ИИ-шных глитчей, из-за которых сердечко замирает в два раза дольше.

#generativeArt@TochkiNadAI
Кто уже потестировал свеженький Kling 2.0?

Кидайте свои работы в комменты!

Пробежался по отзывам пользователей в твиттере, настроения по поводу новой версии очень хорошие, по большей части все очень довольны.

#VideoGenerative@TochkiNadAI
Подписчик поделился тутором: Как сделать POV-ролик

1. Пишем сценарий ролика

Придумываем 5-10 сцен, которые можно показать одним кадре. И не просто рандомные события, а сторителлинг. Недостаточно сгенерировать набор картинок от первого лица — нужна история с завязкой, развитием и финалом. Она должна зацепить с первых секунды. Даже заголовок имеет значение:

Типичный день глазами Пушкина — плохо
День последней дуэли глазами Пушкина — хорошо

2. Формулируем промпты

Для каждой сцены из сценария создаём отдельный промпт — с максимальной детализацией, контекстом и техническими параметрами. Только через точную детали зритель максимально погрузится в атмосферу ролика. С формулировками может помочь ChatGPT.

Начинайте все промпты с фразы «True first-person view...», чтобы получить изображение от лица героя — как будто это видит зритель его глазами.

Пример его промпта:
A true first-person view. Hands hold a spherical white helmet labeled "СССР", arms enclosed in a pressurized suit. Ahead, a tall mirror reflects the full figure. In the background, two Soviet officers watch silently, softened by a shallow depth of field. Warm tungsten light flickers across beige tiled walls. Shot on an IMAX-certified ARRI camera, 35mm lens, f/1.8.

3. Генерируем изображения

Он генерировал изображения в том же ChatGPT — он лучше справляется с кириллицей и запросами на реализм. Если это не в приоритете — можно попробовать Midjourney/Flux. Как минимум, там генерация изображений в десятки раз быстрее.

4. Делаем видео из статики

После первых трех пунктов у нас есть несколько сгенерированных картинок. Поочередно загружаем каждую в Kling или Gen-4 и анимируем. Достаточно сделать из каждого фото 5-секундное видео. Если у нас хотя бы 5 сгенерированных кадров — это уже 25 секунд рилса. Вполне достаточно.

Не усложняйте действия. Камера от первого лица сложна для генерации видео. Лучше сделать простые, но выразительные сцены. Посмотрите, как у него врач измеряет давление Гагарину перед взлетом. Это примерно десятая попытка, после которой он уже сдался. Проще было сгенерировать доктора, который просто смотрит на ртутный термометр.

5. Монтаж и звук

Монтаж ролика очень просто — нужно только собрать все видео в одну . Но сложности начинаются на этапе озвучания.

Звук в этом формате — половина атмосферы. Через него зритель вовлекается в историю. Мы не можем просто подложить трендовую музыку — это не сработает. Идеальный вариант — подзвучить каждый вздох, шаги. Герой просыпается в начале ролика? Пусть он зевнет. Можно качать фри-дорожки, есть куча сервисов или же погенерить отдельно каждый.

Но есть вариант немного проще — подложить тематический звук. В случае с Гагариным — это была его предстартовая речь. У Овечкина— интервью, в котором он говорит, что никогда не побьет рекорд Гретцки.

Канал подписчика.
This media is not supported in your browser
VIEW IN TELEGRAM
Попалось ген-видео, пародирующее многочасовые видео с ютуба со всякими ПрИкОлАмИ.

Это так в духе нашего времени, метамодерн во плоти.

Вот гениальный автор.
OpenAI только что представили две новые модели — o3 и o4-mini

o3 — самая мощная модель OpenAI, делает меньше критичных ошибок, умеет глубоко анализировать визуальные данные, код, научные и бизнес-задачи.

o4-mini — компактная, но умная. Оптимизирована под скорость, дешевле, идеально подходит для массового использования.

Обе модели умеют использовать инструменты ChatGPT (поиск, код, анализ файлов) самостоятельно и стратегически, что приближает нас к “агентному” ИИ.

Модели умеют думать с изображениями — не просто распознают, а используют их в логике рассуждений.

Продолжаем пытаться не запутаться в нейминге моделей😭

Тут подробности.

#LLM@TochkiNadAI
Еще одно небольшое и удобное обновление в ChatGPT

Теперь все сгенерированные изображения хранятся в одном месте. Появился раздел Library. В честь этого демонстрирую вам свои последние генерации.

Раздел живет вот тут.
This media is not supported in your browser
VIEW IN TELEGRAM
Для видеографов и контент-мейкеров

Появилась заявочка на лучший AI-монтаж роликов. Называется Ponder AI.

Говорят будет экономить массу времени не только монтируя, но и редактируя звук. Взаимодействие через естественный язык в LLM-окошке.

Пока что можно только оставить заявку на тест тут.

#videoEditing@TochkiNadAI
2025/06/25 01:24:02
Back to Top
HTML Embed Code: