Forwarded from TechSparks
А вот это просто изящно:)
В генераторе картинок и видео Sora есть галерея текущих генераций, именно в ней зарождаются тренды, который начинают вирусить, как только их подхватывает сообщество авторов. Так было недавно с гиблификацией и с фигурками в коробочках, которые напоминают автора.
Но вот новый тренд: генерить картинки, которые содержат текст, обращенный к разработчика Sora с пожеланиями о доработках или функционале. Этакая публичная обратная связь от пользователей, выдержанная в формате самого продукта. Впечатляет!
https://www.techradar.com/computing/artificial-intelligence/the-hottest-new-ai-image-trend-is-sora-users-begging-for-new-features-using-its-built-in-image-generation-features-and-im-here-for-it
В генераторе картинок и видео Sora есть галерея текущих генераций, именно в ней зарождаются тренды, который начинают вирусить, как только их подхватывает сообщество авторов. Так было недавно с гиблификацией и с фигурками в коробочках, которые напоминают автора.
Но вот новый тренд: генерить картинки, которые содержат текст, обращенный к разработчика Sora с пожеланиями о доработках или функционале. Этакая публичная обратная связь от пользователей, выдержанная в формате самого продукта. Впечатляет!
https://www.techradar.com/computing/artificial-intelligence/the-hottest-new-ai-image-trend-is-sora-users-begging-for-new-features-using-its-built-in-image-generation-features-and-im-here-for-it
TechRadar
The hottest new AI image trend is Sora users begging for new features using its built-in image generation features, and I’m here…
Hey, Sora team, are you listening?
Нашел полезное.
Регулярно обновляемый каталог, в котором собрано более 68 000 GPT-приложений и более 1 100 плагинов.
Называется Plugin Surf.
Внутри реализован поиск по категориям (финансы, разработка, образование, маркетинг и т.д).
#LLM@TochkiNadAI
Регулярно обновляемый каталог, в котором собрано более 68 000 GPT-приложений и более 1 100 плагинов.
Называется Plugin Surf.
Внутри реализован поиск по категориям (финансы, разработка, образование, маркетинг и т.д).
#LLM@TochkiNadAI
This media is not supported in your browser
VIEW IN TELEGRAM
Разбираем пайплайн. Как сделали это видео.
1. Объемный захват в spatial-студии Kartel.ai
2. Создаем окружение с помощью Gaussian Splatting от World Labs
3. Собираем все в WebGL-вьюер
4. Генерация в ComfyUI, с Wan Fun Control
5. Используем две LoRA-модели:
– Первая генерирует стартовый кадр через Flux
– Вторая направляет генерацию Wan 2.1, чтобы сохранить персонажа и позу
На выходе — консистентный, реалистичный персонаж в синтетической 3D-сцене.
1. Объемный захват в spatial-студии Kartel.ai
2. Создаем окружение с помощью Gaussian Splatting от World Labs
3. Собираем все в WebGL-вьюер
4. Генерация в ComfyUI, с Wan Fun Control
5. Используем две LoRA-модели:
– Первая генерирует стартовый кадр через Flux
– Вторая направляет генерацию Wan 2.1, чтобы сохранить персонажа и позу
На выходе — консистентный, реалистичный персонаж в синтетической 3D-сцене.
Не так уж часто у нас тут с вами AI-арт для вдохновения.
Только перед сном не смотрите.
Сегодня не пятница тринадцатое, но я все равно поделюсь с вами двумя любимыми дарксайд ИИ-примерами работ видео-художников.
Для слабонервных чуть позже сделаю подборку любимых мягеньких визуалов, а пока пополним копилку двумя стильными creepy-аккаунтами. Это мои любимки в этом жанре.
solarw.ai – крутейший стиль, сочетающий хтонический сюрреализм постсоветских уездов, как будто Гаспар Ноэ воскресил Балабанова, дал ему безлимитный доступ в Kling и Flux, и начал нашептывать странные вещи на ухо.
MACBETH – безысходность лиминальных пространств, перекрученная через мясорубку ИИ-шных глитчей, из-за которых сердечко замирает в два раза дольше.
#generativeArt@TochkiNadAI
Только перед сном не смотрите.
Сегодня не пятница тринадцатое, но я все равно поделюсь с вами двумя любимыми дарксайд ИИ-примерами работ видео-художников.
Для слабонервных чуть позже сделаю подборку любимых мягеньких визуалов, а пока пополним копилку двумя стильными creepy-аккаунтами. Это мои любимки в этом жанре.
solarw.ai – крутейший стиль, сочетающий хтонический сюрреализм постсоветских уездов, как будто Гаспар Ноэ воскресил Балабанова, дал ему безлимитный доступ в Kling и Flux, и начал нашептывать странные вещи на ухо.
MACBETH – безысходность лиминальных пространств, перекрученная через мясорубку ИИ-шных глитчей, из-за которых сердечко замирает в два раза дольше.
#generativeArt@TochkiNadAI
Кто уже потестировал свеженький Kling 2.0?
Кидайте свои работы в комменты!
Пробежался по отзывам пользователей в твиттере, настроения по поводу новой версии очень хорошие, по большей части все очень довольны.
#VideoGenerative@TochkiNadAI
Кидайте свои работы в комменты!
Пробежался по отзывам пользователей в твиттере, настроения по поводу новой версии очень хорошие, по большей части все очень довольны.
#VideoGenerative@TochkiNadAI
Подписчик поделился тутором: Как сделать POV-ролик
1. Пишем сценарий ролика
Придумываем 5-10 сцен, которые можно показать одним кадре. И не просто рандомные события, а сторителлинг. Недостаточно сгенерировать набор картинок от первого лица — нужна история с завязкой, развитием и финалом. Она должна зацепить с первых секунды. Даже заголовок имеет значение:
• Типичный день глазами Пушкина — плохо
• День последней дуэли глазами Пушкина — хорошо
2. Формулируем промпты
Для каждой сцены из сценария создаём отдельный промпт — с максимальной детализацией, контекстом и техническими параметрами. Только через точную детали зритель максимально погрузится в атмосферу ролика. С формулировками может помочь ChatGPT.
Начинайте все промпты с фразы «True first-person view...», чтобы получить изображение от лица героя — как будто это видит зритель его глазами.
Пример его промпта:
A true first-person view. Hands hold a spherical white helmet labeled "СССР", arms enclosed in a pressurized suit. Ahead, a tall mirror reflects the full figure. In the background, two Soviet officers watch silently, softened by a shallow depth of field. Warm tungsten light flickers across beige tiled walls. Shot on an IMAX-certified ARRI camera, 35mm lens, f/1.8.
3. Генерируем изображения
Он генерировал изображения в том же ChatGPT — он лучше справляется с кириллицей и запросами на реализм. Если это не в приоритете — можно попробовать Midjourney/Flux. Как минимум, там генерация изображений в десятки раз быстрее.
4. Делаем видео из статики
После первых трех пунктов у нас есть несколько сгенерированных картинок. Поочередно загружаем каждую в Kling или Gen-4 и анимируем. Достаточно сделать из каждого фото 5-секундное видео. Если у нас хотя бы 5 сгенерированных кадров — это уже 25 секунд рилса. Вполне достаточно.
Не усложняйте действия. Камера от первого лица сложна для генерации видео. Лучше сделать простые, но выразительные сцены. Посмотрите, как у него врач измеряет давление Гагарину перед взлетом. Это примерно десятая попытка, после которой он уже сдался. Проще было сгенерировать доктора, который просто смотрит на ртутный термометр.
5. Монтаж и звук
Монтаж ролика очень просто — нужно только собрать все видео в одну . Но сложности начинаются на этапе озвучания.
Звук в этом формате — половина атмосферы. Через него зритель вовлекается в историю. Мы не можем просто подложить трендовую музыку — это не сработает. Идеальный вариант — подзвучить каждый вздох, шаги. Герой просыпается в начале ролика? Пусть он зевнет. Можно качать фри-дорожки, есть куча сервисов или же погенерить отдельно каждый.
Но есть вариант немного проще — подложить тематический звук. В случае с Гагариным — это была его предстартовая речь. У Овечкина— интервью, в котором он говорит, что никогда не побьет рекорд Гретцки.
Канал подписчика.
1. Пишем сценарий ролика
Придумываем 5-10 сцен, которые можно показать одним кадре. И не просто рандомные события, а сторителлинг. Недостаточно сгенерировать набор картинок от первого лица — нужна история с завязкой, развитием и финалом. Она должна зацепить с первых секунды. Даже заголовок имеет значение:
• Типичный день глазами Пушкина — плохо
• День последней дуэли глазами Пушкина — хорошо
2. Формулируем промпты
Для каждой сцены из сценария создаём отдельный промпт — с максимальной детализацией, контекстом и техническими параметрами. Только через точную детали зритель максимально погрузится в атмосферу ролика. С формулировками может помочь ChatGPT.
Начинайте все промпты с фразы «True first-person view...», чтобы получить изображение от лица героя — как будто это видит зритель его глазами.
Пример его промпта:
A true first-person view. Hands hold a spherical white helmet labeled "СССР", arms enclosed in a pressurized suit. Ahead, a tall mirror reflects the full figure. In the background, two Soviet officers watch silently, softened by a shallow depth of field. Warm tungsten light flickers across beige tiled walls. Shot on an IMAX-certified ARRI camera, 35mm lens, f/1.8.
3. Генерируем изображения
Он генерировал изображения в том же ChatGPT — он лучше справляется с кириллицей и запросами на реализм. Если это не в приоритете — можно попробовать Midjourney/Flux. Как минимум, там генерация изображений в десятки раз быстрее.
4. Делаем видео из статики
После первых трех пунктов у нас есть несколько сгенерированных картинок. Поочередно загружаем каждую в Kling или Gen-4 и анимируем. Достаточно сделать из каждого фото 5-секундное видео. Если у нас хотя бы 5 сгенерированных кадров — это уже 25 секунд рилса. Вполне достаточно.
Не усложняйте действия. Камера от первого лица сложна для генерации видео. Лучше сделать простые, но выразительные сцены. Посмотрите, как у него врач измеряет давление Гагарину перед взлетом. Это примерно десятая попытка, после которой он уже сдался. Проще было сгенерировать доктора, который просто смотрит на ртутный термометр.
5. Монтаж и звук
Монтаж ролика очень просто — нужно только собрать все видео в одну . Но сложности начинаются на этапе озвучания.
Звук в этом формате — половина атмосферы. Через него зритель вовлекается в историю. Мы не можем просто подложить трендовую музыку — это не сработает. Идеальный вариант — подзвучить каждый вздох, шаги. Герой просыпается в начале ролика? Пусть он зевнет. Можно качать фри-дорожки, есть куча сервисов или же погенерить отдельно каждый.
Но есть вариант немного проще — подложить тематический звук. В случае с Гагариным — это была его предстартовая речь. У Овечкина— интервью, в котором он говорит, что никогда не побьет рекорд Гретцки.
Канал подписчика.
This media is not supported in your browser
VIEW IN TELEGRAM
Попалось ген-видео, пародирующее многочасовые видео с ютуба со всякими ПрИкОлАмИ.
Это так в духе нашего времени, метамодерн во плоти.
Вот гениальный автор.
Это так в духе нашего времени, метамодерн во плоти.
Вот гениальный автор.
OpenAI только что представили две новые модели — o3 и o4-mini
o3 — самая мощная модель OpenAI, делает меньше критичных ошибок, умеет глубоко анализировать визуальные данные, код, научные и бизнес-задачи.
o4-mini — компактная, но умная. Оптимизирована под скорость, дешевле, идеально подходит для массового использования.
Обе модели умеют использовать инструменты ChatGPT (поиск, код, анализ файлов) самостоятельно и стратегически, что приближает нас к “агентному” ИИ.
Модели умеют думать с изображениями — не просто распознают, а используют их в логике рассуждений.
Продолжаем пытаться не запутаться в нейминге моделей😭
Тут подробности.
#LLM@TochkiNadAI
o3 — самая мощная модель OpenAI, делает меньше критичных ошибок, умеет глубоко анализировать визуальные данные, код, научные и бизнес-задачи.
o4-mini — компактная, но умная. Оптимизирована под скорость, дешевле, идеально подходит для массового использования.
Обе модели умеют использовать инструменты ChatGPT (поиск, код, анализ файлов) самостоятельно и стратегически, что приближает нас к “агентному” ИИ.
Модели умеют думать с изображениями — не просто распознают, а используют их в логике рассуждений.
Продолжаем пытаться не запутаться в нейминге моделей😭
Тут подробности.
#LLM@TochkiNadAI
Еще одно небольшое и удобное обновление в ChatGPT
Теперь все сгенерированные изображения хранятся в одном месте. Появился раздел Library. В честь этого демонстрирую вам свои последние генерации.
Раздел живет вот тут.
Теперь все сгенерированные изображения хранятся в одном месте. Появился раздел Library. В честь этого демонстрирую вам свои последние генерации.
Раздел живет вот тут.
This media is not supported in your browser
VIEW IN TELEGRAM
Для видеографов и контент-мейкеров
Появилась заявочка на лучший AI-монтаж роликов. Называется Ponder AI.
Говорят будет экономить массу времени не только монтируя, но и редактируя звук. Взаимодействие через естественный язык в LLM-окошке.
Пока что можно только оставить заявку на тест тут.
#videoEditing@TochkiNadAI
Появилась заявочка на лучший AI-монтаж роликов. Называется Ponder AI.
Говорят будет экономить массу времени не только монтируя, но и редактируя звук. Взаимодействие через естественный язык в LLM-окошке.
Пока что можно только оставить заявку на тест тут.
#videoEditing@TochkiNadAI