Telegram Group Search
ИИ сделает нас тупее?

Привет, друзья!

Я решил немного отдохнуть на праздниках, поэтому уже вторую неделю не выпускаю обучающий контент. Вместо этого я вплотную занялся постройкой корча с помощью ChatGPT и Gemini. Да-да, нейросети подбирали комплектующие, выставляли параметры, диагностировали проблемы для реальной машины. Т.е. теперь результаты работы ИИ я могу видеть не только на экране компьютера, а буквально почувствовать своей задницей при перегрузках.

Тачка уже собрана и проходит обкатку: под капотом около 500 л.с. с двухлитрового двигателя. Если вам интересно, какую роль в этом всём играет ИИ - ставьте 🔥 и подробнее расскажу об этом в отдельном посте.

Помимо этого, проветриваю голову на мотоцикле и сознательно ограничиваю время за компьютером вне работы. В таком расслабленном режиме планирую провести остаток праздников, чтобы мозг мог реально отдохнуть.

И вот тут как раз возникает интересная тема.

Недавно наткнулся на популярное мнение: мол, появление ИИ сделает нас тупее, поскольку заберёт большую часть задач себе. Но давайте разберёмся чуть глубже.

Раньше любая работа делилась на две части: проектирование и рутину. На первом этапе мы активно напрягали мозги, решая сложные задачи. А на втором действовали автоматически, выполняя действия, которые не требуют творческих усилий. Например, художник сначала продумывал композицию и концепт, а потом более монотонно заполнял детали и доводил всё до финала.

ИИ действительно отбирает часть работы, но заметьте, он забирает именно рутину, оставляя самое важное — этап созидания идеи. Парадокс в том, что без рутины мозг отдыхает намного меньше, так как постоянно занимается сложной творческой деятельностью.

И именно поэтому, для тех, кому всегда было интересно исследовать, создавать и идти глубже, появление генеративного интеллекта - сногсшибательная возможность резко ускорить своё развитие. Нейросети освобождают наши мозги от надоевшей монотонности, позволяя сосредоточиться на главном: экспериментах, творчестве и креативе. Кто умел думать, начнёт думать быстрее и эффективнее.

Но одновременно с этим те, кто всегда работал исключительно за деньги и старался делать минимально необходимое, действительно могут стать жертвой деградации. И вот тут каждый сам решает, кем ему быть: автором нового мира или пассивным зрителем чужих успехов.

Пишите в комментариях, ИИ уже начал вас оболванивать — или наоборот, прокачивает ваш мозг как никогда?
Please open Telegram to view this post
VIEW IN TELEGRAM
Я сделал идеальную игру для мотоциклистов.
Я сделал идеальную игру для автомобилистов.
Крутая модель для редактирования фото Dough.

К 9 мая я хотел написать пост о простом и качественном решении для старых фото. Но всё оказалось не так просто. Я прошёлся по всем известным сервисам в поисках решения, которое позволит легко превращать старые ЧБ фотографии в современные и цветные.

Начал, конечно, с ChatGPT. Он выдал самое крутое качество. Но проблема заключалась в том, что он значительно менял содержимое фотографий.

KREA и Freepik тоже не дали стабильного результата. Готовые сервисы использовали SDXL, поэтому я собрал свой workflow в ComfyUI, но это не было простым решением, как я хотел. Мне хотелось получить доступный однокнопочный вариант. Поэтому идею я отложил.

Как выяснилось — ненадолго, т.к. вышла новая модель Dough, которая сейчас доступна в KREA.ai. Работает не идеально, но достаточно просто. Она позволяет не только раскрашивать ЧБ изображения, но и имеет крутые функции редактирования, в т.ч. переноса лиц в новую сцену (см. последний пример). Загружаете референсную картинку и говорите, что исправить.

Что думаете? Огонь🔥?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Монтаж 331 фильма в один трек Эминема.

Обычно я не выкладываю чужие работы, но тут такой мощный креатив, что грех не поделиться. Простая идея — но сделано прямо огонь!

Чувак взял 331 фильм и смонтировал из них полноценный трек Эминема. Я пообщался с автором, Росом Томпсоном, и, конечно, не обошлось без нейросетей: ChatGPT помогал искать подходящие фразы, а Auphonic вытаскивал голос из фильмов, убирая лишний шум и музыку.

От себя добавлю: несмотря на помощь нейросетей, это адски кропотливая и выматывающая монтажная работа.

Оригинал на YouTube.
Please open Telegram to view this post
VIEW IN TELEGRAM
Veo 3, Flow и другое из Google I/O.

Вчера Google показали Veo 3 и новые возможности Veo 2, доступные на их обновленной платформе Flow (требует VPN США, и американского аккаунта гугл).

Выглядит всё очень круто, но чертовски дорого. Veo3 будет доступен только премиум юзерами Flow за ($125 первые 3 месяца) и $250 после. У новой модели сильно улучшили качество, прикрутили генерацию звука к видео.
Улучшили и Veo2: добавили принудительный контроль камеры, появилась first-last frame и multi-elements, как у Kling (но проверил, пока не доступно).

Как только откроются все функции - проведу сравнительный тест новой модели с veo 2 и Kling 2.0.
Токены, мотоциклисты и чашка чая

Впервые понятие "очки внимания" или "attention points" ввёл американский мотоинструктор Кейт Код. Многие мотоциклисты, в том числе и в России, знают его книги и используют их как "библию по выживанию на мотоцикле".

Код объясняет, что у каждого мотоциклиста есть ограниченный объём внимания — как чашка, наполненная до краёв. Когда вы только начинаете ездить, всё — от переключения передач до поворота головы — требует концентрации. Вы не знаете, на чём сфокусироваться, поэтому пытаетесь удержать в поле зрения всё сразу. Ни одно движение ещё не дошло до «мышечной памяти» — каждое приходится продумывать. В такой перегрузке любая неожиданность легко переполняет чашку — и в этот момент вы теряете контроль или делаете ошибку.

Ровно так же работает контекстное окно LLM. Когда вы общаетесь с нейросетью (например, с ChatGPT, Gemini или любой другой), вы "наливаете" в эту чашку чая информацию:

- Ваши вопросы и промпты.
- Предыдущие реплики в диалоге (чтобы нейросеть помнила, о чем вы говорили раньше).
- Любые изображения или файлы, которые вы ей предоставляете.
- "Размышления" или "Chain-of-Thought" мыслящих моделей тоже наполняют чашку.

Нейросеть не видит текст так, как мы – целыми словами и предложениями. Она разбивает его на маленькие кусочки – токены. И каждая такая частичка – это как капля, добавляемая в чашку чая.

Проще говоря: Одно слово может быть одной каплей ("привет"), а может быть и несколькими "каплями", если слово длинное или сложное (например, "искусственный" = "искусств" + "енн" + "ый" – три капли). Даже знаки препинания – это отдельные маленькие "капельки"!

Понимание этого помогает лучше общаться с нейросетями:

- Цените каждую каплю. Пишите по-делу. Чем меньше воды тем крепче чай, и тем меньше токенов он занимает. Значит, больше останется на ответ.

- Не бойтесь начать с чистого листа. Если модель начинает "галлюцинировать" или писать чушь — возможно, контекстное окно переполнено. В таких случаях я обычно прошу сделать сводку нашего разговора в 3-4 тыс. символов, и создаю новый чат. Можете, конечно, тезисно напомнить ей важные вещи, но скорее всего это поможет не на долго.

Теперь вы знаете что такое токены, и как работает контекстное окно LLM.
Приятного вам чаепития и аккуратнее на дорогах
🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Будущее уже здесь!

Помните, как Том Круз в «Особом мнении» эффектно вращал сцену в погоне за деталями будущего? Теперь это не фантастика — это наш сегодняшний день!

ИИ научился создавать полное 3D-пространство из обычного видео. Вы можете прямо сейчас бесплатно погрузиться в эту технологиюо вот тут.

Представьте какие возможности это открывает эта технология. Например, смотрить любимый фильм, ставить его на паузу, чтобы осмотреть каждый угол сцены и разглядеть детали с любого ракурса.

Или представьте, как легко можно будет корректировать операторскую работу на постах.

Я тут погуглил. За всей этой крутью стоят два увлечённых китайских энтузиаста — Сунь Цзямин и Чжан Сиюй. Чуваки, вдохновлённые мечтой создать технологию, где каждый сможет буквально «войти» в видеоролик, они бросили престижные работы и ушли в рискованный мир стартапов. Как по сценарию хорошего кино, их первый проект столкнулся с разочарованиями, но не сломил их дух — наоборот, научил видеть возможности там, где другие видят провалы. И вот их новая идея — стрельнула. И не просто стрельнула, а потрясает воображение даже опытных инженеров.

Огонь же? Ну? 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/06/14 01:44:09
Back to Top
HTML Embed Code: