Небольшие итоги года.
Любимая работа года: Панельск. Примечательно, что сделан в стареньком Gen-2.
Вторая любимая работа года: Бесконечный маршрут. Жаль, что не особо залетел.
Самая вирусная работа года: Мемовселенная безумия и серия мемов из альтернативной реальности . Больше 4 миллионов просмотров только в Инстаграме.
Проклятое года: заставка Улицы разбитых фонарей, но это Улица сезам.
Расследование года: выяснил причину автоматических банов в Midjourney. Музыкальный номер года: альбом SUNO каверов на MC Dimanche - Шашлычок.
LLM года: Claude.
Видео-модель года: Kling.
Новичок года: Flux.
Молодец года: тот, кто это сейчас читает.
С наступающим!🥂
Любимая работа года: Панельск. Примечательно, что сделан в стареньком Gen-2.
Вторая любимая работа года: Бесконечный маршрут. Жаль, что не особо залетел.
Самая вирусная работа года: Мемовселенная безумия и серия мемов из альтернативной реальности . Больше 4 миллионов просмотров только в Инстаграме.
Проклятое года: заставка Улицы разбитых фонарей, но это Улица сезам.
Расследование года: выяснил причину автоматических банов в Midjourney. Музыкальный номер года: альбом SUNO каверов на MC Dimanche - Шашлычок.
LLM года: Claude.
Видео-модель года: Kling.
Новичок года: Flux.
Молодец года: тот, кто это сейчас читает.
С наступающим!
Please open Telegram to view this post
VIEW IN TELEGRAM
Короткий тренд-репорт 2025 от меня.
Если совсем коротко, то всё продолжит развиваться на сверхскоростях, но появится кое-что интересное.
1. Знание нейросетей: новая норма, как "уверенный пользователь ПК".
2. Видео: стремительный рост качества и контроля. Kling 2, Sora 2, Runway Gen-4, open-source. Китайцы продолжат удивлять.
3. 3D: Наконец-то сможем создавать качественные модели. Советую начать изучать, например, Blender.
4. LLM: Большой шаг в сторону AGI с выходом o3 от OpenAI, а в дальнейшем аналогов — Claude и т.д. Reasoning станет новой нормой.
5. Персонализация: нейросети будут всё больше адаптироваться под вас и ваши хотелки.
6. Мобильность: продолжение прошлогоднего тренда. Джарвис Тони Старка в вашем кармане. Возможно, в этом или следующем году OpenAI представит своё устройство.
7. Flux: с поддержкой сообщества окончательно вытеснит Stable Diffusion.
8. Агенты в массы: новинка в нашем нейрозоопарке. Если вы ещё не знакомы, это автономные AI-системы, которые могут выполнять сложные задачи без постоянного кожанного контроля. Сэм Альтман отмечает, что в ближайшие два года AI-агенты начнут активно занимать рабочие места, выполняя задачи быстрее и эффективнее людей. Пока это история для избранных, но в этом году ожидаю решения для массовой аудитории.
9. Мультимодальность: продолжение тренда. Более эффективная интеграция моделей с текстом, изображениями, видео и звуком для нативного взаимодействия.
10. Скам: будет расти. Будьте осторожны.
11. Фейк-ньюс: см. пункт 10.
12. Регуляции: будут крепчать. См. пункты 10 и 11.
Как всегда, будет интересно, динамично, а местами — весело. Добро пожаловать в 2025!🥂
Если совсем коротко, то всё продолжит развиваться на сверхскоростях, но появится кое-что интересное.
1. Знание нейросетей: новая норма, как "уверенный пользователь ПК".
2. Видео: стремительный рост качества и контроля. Kling 2, Sora 2, Runway Gen-4, open-source. Китайцы продолжат удивлять.
3. 3D: Наконец-то сможем создавать качественные модели. Советую начать изучать, например, Blender.
4. LLM: Большой шаг в сторону AGI с выходом o3 от OpenAI, а в дальнейшем аналогов — Claude и т.д. Reasoning станет новой нормой.
5. Персонализация: нейросети будут всё больше адаптироваться под вас и ваши хотелки.
6. Мобильность: продолжение прошлогоднего тренда. Джарвис Тони Старка в вашем кармане. Возможно, в этом или следующем году OpenAI представит своё устройство.
7. Flux: с поддержкой сообщества окончательно вытеснит Stable Diffusion.
8. Агенты в массы: новинка в нашем нейрозоопарке. Если вы ещё не знакомы, это автономные AI-системы, которые могут выполнять сложные задачи без постоянного кожанного контроля. Сэм Альтман отмечает, что в ближайшие два года AI-агенты начнут активно занимать рабочие места, выполняя задачи быстрее и эффективнее людей. Пока это история для избранных, но в этом году ожидаю решения для массовой аудитории.
9. Мультимодальность: продолжение тренда. Более эффективная интеграция моделей с текстом, изображениями, видео и звуком для нативного взаимодействия.
10. Скам: будет расти. Будьте осторожны.
11. Фейк-ньюс: см. пункт 10.
12. Регуляции: будут крепчать. См. пункты 10 и 11.
Как всегда, будет интересно, динамично, а местами — весело. Добро пожаловать в 2025!
Please open Telegram to view this post
VIEW IN TELEGRAM
Runway #Gen3 добавили апскейл до 4к.
Причем как-то по тихому и незаметно (см. скриншот, где он спрятался). Теперь, по идее, можно генерировать видео не стыдного качества, которое годится для серьезного продакшена. Но так ли это? Об этом следующий пост с тестом.
Причем как-то по тихому и незаметно (см. скриншот, где он спрятался). Теперь, по идее, можно генерировать видео не стыдного качества, которое годится для серьезного продакшена. Но так ли это? Об этом следующий пост с тестом.
4k.mp4
244.2 MB
Тест 4k апскейла #Gen3 и выводы.
Короче, две новости:
Хорошая: он действительно апскейлит генерации созданные в 720p.
Плохая: он действительно апскейлит генерации созданные в 720p.
Значение: что все кривое, косое, мутное, не идеальное, что выдаст вам Gen3 волшебным образом не исчезнет, а станет гораздо заметнее.
Но: Инструмент будет полезным, если само качество генераций подтянется, например, до флагмана Kling 1.6 и выше.
Сделал много тестов, но держите img-to-video красивого водопада, который на днях сфотографировал.
Короче, две новости:
Хорошая: он действительно апскейлит генерации созданные в 720p.
Плохая: он действительно апскейлит генерации созданные в 720p.
Значение: что все кривое, косое, мутное, не идеальное, что выдаст вам Gen3 волшебным образом не исчезнет, а станет гораздо заметнее.
Но: Инструмент будет полезным, если само качество генераций подтянется, например, до флагмана Kling 1.6 и выше.
Сделал много тестов, но держите img-to-video красивого водопада, который на днях сфотографировал.
This media is not supported in your browser
VIEW IN TELEGRAM
Очень занимательная и наглядная эволюция видео-моделей за два года (нашел в Твиттере). Для большего контраста можно было взять и китайский modelscope, но и так годно.
Интересный ход от Krea. Ну и вообще они молодцы, с точки зрения продукта. Их генерация в режиме реального времени по калякам-малякам — это прям мастхев во многих дизайнерских/арт-директорских пайпланах. Если вы вдруг не пользуетесь, то крайне рекомендую. Ещё и бесплатно (почти).
Касательно самих тридешек — они крайне условные, но для скетча — то, что нужно.
Касательно самих тридешек — они крайне условные, но для скетча — то, что нужно.
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Krea добавила инструмент, который переводит некоторые объекты генерации в трехмерное представление.
Помните, я говорил: когда все наиграются с красивыми картинками, начнут уходить в тулзы? Надеюсь, это уже началось. На самом деле, для такого инструмента не нужна суперточная система генерации геометрии, и это хорошо. Перевод объекта в 3D займет наименьшее количество времени, остальное дорисуется.
Кажется, мы увидели гибрид пейджера и телефона.
@CGIT_Vines
Помните, я говорил: когда все наиграются с красивыми картинками, начнут уходить в тулзы? Надеюсь, это уже началось. На самом деле, для такого инструмента не нужна суперточная система генерации геометрии, и это хорошо. Перевод объекта в 3D займет наименьшее количество времени, остальное дорисуется.
Кажется, мы увидели гибрид пейджера и телефона.
@CGIT_Vines
Media is too big
VIEW IN TELEGRAM
В #Kling выкатилась крутая фича Elements, которая позволяет в видео соединять различные картинки (до 4 штук). Записал быстрый минутный тест, как это работает. Прошу прощения за голос из бочки.
This media is not supported in your browser
VIEW IN TELEGRAM
Метаверсище и ИИще написал о похожей функции Minimax Subject Reference. Выглядит круто, особенно в примере, который нашел в Твиттере (или X, кому как удобно).
Please open Telegram to view this post
VIEW IN TELEGRAM
Тренд-репорт начал сбываться раньше, чем думал. Вот подвезли доступного для масс агента от отцов OpenAI под названием Operator (ОЛО).
Может за вастроллить , иcкать информацию, делать покупки и выполнять другие действия во всемирной паутине Пока доступен для богачей, можно, например посмотреть, как Денис использует. А обычные смертные ждут недельку, чтобы мощно протестировать. Как это технически работает можно посмотреть здесь.
Может показаться приколом, но но словам того же Альтмана агенты в ближайшие два года начнут активно занимать рабочие места, выполняя задачи быстрее и эффективнее кожанных. Поэтому не пропускаем.
Вовлекающий вопрос для обсуждения - для чего вы бы использовали агентов? Я бы собирал маркетинговую инфу, ресерчи, вот это вот все.
Может за вас
Может показаться приколом, но но словам того же Альтмана агенты в ближайшие два года начнут активно занимать рабочие места, выполняя задачи быстрее и эффективнее кожанных. Поэтому не пропускаем.
Вовлекающий вопрос для обсуждения - для чего вы бы использовали агентов? Я бы собирал маркетинговую инфу, ресерчи, вот это вот все.
И к новостям робототехники 🕺
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Значит, смотрите, все как учил вас в 2025!
Сначала отстреливаем каждую из семи щупалец. После того как он перестанет вас хватать, целимся в светящийся оранжевый треугольник, между сенсорами. Как убьете, не подходите сразу для сбора дропа — после смерти они, как правило, взрываются!
Сначала отстреливаем каждую из семи щупалец. После того как он перестанет вас хватать, целимся в светящийся оранжевый треугольник, между сенсорами. Как убьете, не подходите сразу для сбора дропа — после смерти они, как правило, взрываются!