OpenAI CUA значительно превзошёл предыдущую SOTA. в OSWorld результат вырос с 22 до 38%.
В WebArena OpenAI CUA сравнялся с лучшими веб-агентами 58 против 57%.
В WebVoyager OpenAI CUA достиг максимального результата 87%, совпадая с лучшими веб-агентами.
Люди по-прежнему лучше справляются с задачами, но надолго ли🎼
Если что, CUA – это Compute‑Using Agent. А то опять куча аббревиатур, не всем понятных, всё как любят в оупенаи😎
Агенты могут:
– искать и применять данные из интернета
– управлять вашим ПК автономно
– искать любые файлы локально
В WebArena OpenAI CUA сравнялся с лучшими веб-агентами 58 против 57%.
В WebVoyager OpenAI CUA достиг максимального результата 87%, совпадая с лучшими веб-агентами.
Люди по-прежнему лучше справляются с задачами, но надолго ли
Если что, CUA – это Compute‑Using Agent. А то опять куча аббревиатур, не всем понятных, всё как любят в оупенаи
Агенты могут:
– искать и применять данные из интернета
– управлять вашим ПК автономно
– искать любые файлы локально
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Super Mario Bros, как способ потестить модель на эффективность
Исследователи из Hao AI Lab поставили перед ведущими LLM задачку: поиграть в Super Mario. Используя фреймворк GamingAgent, модели обрабатывали игру кадр за кадром, получая только базовые инструкции. Цель? Планируйте, реагируйте и разрабатывайте стратегию.
Результаты:
– Лучше всех затащил Клодовский Сонет 3.7
– Хуже всех – модели с большим количеством рассуждений, такие как o1
Оказалось, что быстрая реакция иногда побеждает глубокую логику.
Исследователи из Hao AI Lab поставили перед ведущими LLM задачку: поиграть в Super Mario. Используя фреймворк GamingAgent, модели обрабатывали игру кадр за кадром, получая только базовые инструкции. Цель? Планируйте, реагируйте и разрабатывайте стратегию.
Результаты:
– Лучше всех затащил Клодовский Сонет 3.7
– Хуже всех – модели с большим количеством рассуждений, такие как o1
Оказалось, что быстрая реакция иногда побеждает глубокую логику.
This media is not supported in your browser
VIEW IN TELEGRAM
Тут в силу интереса к AI-агентам набрел на ценную подборку в соседнем канале.
Ссылки на ресурсы для построения мультиагентной архитектуры AI:
Основы для проектирования мультиагентности:
https://www.anthropic.com/research/building-effective-agents (описание базовых архитектур)
https://platform.openai.com/docs/guides/prompt-engineering база
https://medium.com/google-cloud/designing-cognitive-architectures-agentic-workflow-patterns-from-scratch-63baa74c54bc
https://www.llamaindex.ai/blog/building-a-multi-agent-concierge-system
https://github.com/wandb/wandbot
https://applied-llms.org/
Как правильно дизайнить промпты, в том числе для мультиагентности:
https://www.evidentlyai.com/llm-guide/llm-as-a-judge
https://logikon.ai/docs/delib_prompting
https://towardsdatascience.com/diving-deeper-with-structured-outputs-b4a5d280c208/
https://www.prompthub.us/blog/prompt-chaining-guide (и вообще промпт хаб)
https://www.prompthub.us/blog/how-to-give-your-chatbot-more-memory
https://www.prompthub.us/blog/prompt-engineering-principles-for-2024
https://www.promptingguide.ai/techniques/fewshot
Записи докладов с AI Engineer Summit 2025 здесь.
В чатике подборкой поделился мой знакомый Владимир Гусев, ну а за саму подборку спасибо Александру Тарасову - CTO at Saola, ex-CTO Food Rocket.
Ссылки на ресурсы для построения мультиагентной архитектуры AI:
Основы для проектирования мультиагентности:
https://www.anthropic.com/research/building-effective-agents (описание базовых архитектур)
https://platform.openai.com/docs/guides/prompt-engineering база
https://medium.com/google-cloud/designing-cognitive-architectures-agentic-workflow-patterns-from-scratch-63baa74c54bc
https://www.llamaindex.ai/blog/building-a-multi-agent-concierge-system
https://github.com/wandb/wandbot
https://applied-llms.org/
Как правильно дизайнить промпты, в том числе для мультиагентности:
https://www.evidentlyai.com/llm-guide/llm-as-a-judge
https://logikon.ai/docs/delib_prompting
https://towardsdatascience.com/diving-deeper-with-structured-outputs-b4a5d280c208/
https://www.prompthub.us/blog/prompt-chaining-guide (и вообще промпт хаб)
https://www.prompthub.us/blog/how-to-give-your-chatbot-more-memory
https://www.prompthub.us/blog/prompt-engineering-principles-for-2024
https://www.promptingguide.ai/techniques/fewshot
Записи докладов с AI Engineer Summit 2025 здесь.
В чатике подборкой поделился мой знакомый Владимир Гусев, ну а за саму подборку спасибо Александру Тарасову - CTO at Saola, ex-CTO Food Rocket.
This media is not supported in your browser
VIEW IN TELEGRAM
Для тех кто работает с данными и устал от парсеров
Нашел такую штуку, называется Kadoa.
Указываешь сайт, а модель автоматически находит и структурирует данные. Даже если верстку поменяют, она адаптируется. Работает для товаров, вакансий, статей, любых текстовых баз.
Можно выгружать данные в CSV, сервис потом еще и сам следит за всеми обновлениями.
#data@TochkiNadAI
Нашел такую штуку, называется Kadoa.
Указываешь сайт, а модель автоматически находит и структурирует данные. Даже если верстку поменяют, она адаптируется. Работает для товаров, вакансий, статей, любых текстовых баз.
Можно выгружать данные в CSV, сервис потом еще и сам следит за всеми обновлениями.
#data@TochkiNadAI
This media is not supported in your browser
VIEW IN TELEGRAM
Сегодня посмотрим на удобный инструмент для контент-маркетинга
Если ищете простой и недорогой инструмент для планирования контента, FeedHive – неплохой вариантик. Его AI-инструменты помогают сгенерировать идеи, подобрать хештеги и адаптировать посты под разные платформы – всё в одном интерфейсе.
Еще один плюс – аналитика. Можно отслеживать активность аудитории и эффективность постов. Тарифы стартуют с $19/месяц.
#socialMedia@TochkiNadAI
Если ищете простой и недорогой инструмент для планирования контента, FeedHive – неплохой вариантик. Его AI-инструменты помогают сгенерировать идеи, подобрать хештеги и адаптировать посты под разные платформы – всё в одном интерфейсе.
Еще один плюс – аналитика. Можно отслеживать активность аудитории и эффективность постов. Тарифы стартуют с $19/месяц.
#socialMedia@TochkiNadAI
This media is not supported in your browser
VIEW IN TELEGRAM
Пополнение в рядах AI-девайсов
Такая вот книжная закладка. Дизайн симпатичный – минимализм, эпл, в эту сторону.
Делает саммари, есть небольшая геймификация в соревновании с друзьями по чтению, работает как хэбит-трекер и позволяет сохранять заметки.
Кстати, к слову об AI-девайсах, полгода назад был "бум" клипс с ИИ, которые можно было крепить на одежду или носить как украшения на шее и пальцах. Кто-нибудь купил себе что-то из этого?
#device@TochkiNadAI
Такая вот книжная закладка. Дизайн симпатичный – минимализм, эпл, в эту сторону.
Делает саммари, есть небольшая геймификация в соревновании с друзьями по чтению, работает как хэбит-трекер и позволяет сохранять заметки.
Кстати, к слову об AI-девайсах, полгода назад был "бум" клипс с ИИ, которые можно было крепить на одежду или носить как украшения на шее и пальцах. Кто-нибудь купил себе что-то из этого?
#device@TochkiNadAI
Давайте сегодня про дипфейки
Собрал для вас небольшую подборку сервисов разного уровня сложности и ценообразования.
1. Pseudoface. Что-то вроде продвинутой ретуши дипфейком. Ну то есть можно немножко зафейкать лицо, но можно и изменить его до неузнаваемости. Есть приложение для iOS. 15$ / 15 минут видео и 150 фоток.
2. Kapwing. Довольно удобный редактор в вебе. Есть бесплатный период.
3. DeepFaceLab. Стандартная замена лица на картинках и в роликах.
Полная замена головы с сохранением уникальных деталей (родинки, тату, сережки) Реалистичная анимация губ при разговоре и др. Для более сложных задач.
4. Reface. Если хочется просто поиграть с готовыми шаблонами на основе одной фотографии.
5. DeepfakesWeb. Упрощенный веб-интерфейс с бесплатными кредитами.
6. Facewap. Качественный редактор в формате нативного приложения для Линукс и Винды. Насколько мне известно – полностью бесплатное.
#deepfake@TochkiNadAI
Собрал для вас небольшую подборку сервисов разного уровня сложности и ценообразования.
1. Pseudoface. Что-то вроде продвинутой ретуши дипфейком. Ну то есть можно немножко зафейкать лицо, но можно и изменить его до неузнаваемости. Есть приложение для iOS. 15$ / 15 минут видео и 150 фоток.
2. Kapwing. Довольно удобный редактор в вебе. Есть бесплатный период.
3. DeepFaceLab. Стандартная замена лица на картинках и в роликах.
Полная замена головы с сохранением уникальных деталей (родинки, тату, сережки) Реалистичная анимация губ при разговоре и др. Для более сложных задач.
4. Reface. Если хочется просто поиграть с готовыми шаблонами на основе одной фотографии.
5. DeepfakesWeb. Упрощенный веб-интерфейс с бесплатными кредитами.
6. Facewap. Качественный редактор в формате нативного приложения для Линукс и Винды. Насколько мне известно – полностью бесплатное.
#deepfake@TochkiNadAI
Я тут вдруг подумал, а чего все молчат про Apple Intelligence?
AI гонку Apple проигрывает, очевидно, но все-таки что-то же должно происходить. Дело в том, что ключевые функции AI от эппле отложены до 2026 года, а по некоторым данным вплоть до 2027.
С момента релиза текущей версии я ни разу не тестировал то, что в итоге выкатили, и вот решил потестить.
✦ Начал с функции CleanUp в галерее. Там можно выбрать фото и убрать на нем лишние объекты. Айфон сообщил что я должен быть подключен к вай-фай, без этого магии не будет. Вай-фай подключен был, а магии так и не случилось. У меня не заработало.
✦ Умные уведомления не срабатывают, либо я этого не замечаю. Кстати, для этого и для большинства других функций смартфон должен быть на английском языке, то есть нужно сменить язык, если он у вас на русском.
✦ ChatGPT теперь поселился прямо в айфоне в качестве расширения, наравне с Siri. Я продолжаю использовать оригинальное приложение, так удобнее.
✦ Напоследок потестил Playground (приложение, которое появилось вместе с обновлением OS, прикладываю к посту скрины оттуда). Вот эту штуку вообще лучше бы не выкатывали, Стив Джобс за такое откусил бы руки или еще один кусок яблока. Приложение задумывалось как редактор для создания веселеньких картинок, но на мой взгляд такое могло бы выглядеть весело в 2021 году, при этом качество тоже из 2021 года.
В общем Apple Intelligence не оправдал свою аббревиатуру, по крайней мере пока.
AI гонку Apple проигрывает, очевидно, но все-таки что-то же должно происходить. Дело в том, что ключевые функции AI от эппле отложены до 2026 года, а по некоторым данным вплоть до 2027.
С момента релиза текущей версии я ни разу не тестировал то, что в итоге выкатили, и вот решил потестить.
✦ Начал с функции CleanUp в галерее. Там можно выбрать фото и убрать на нем лишние объекты. Айфон сообщил что я должен быть подключен к вай-фай, без этого магии не будет. Вай-фай подключен был, а магии так и не случилось. У меня не заработало.
✦ Умные уведомления не срабатывают, либо я этого не замечаю. Кстати, для этого и для большинства других функций смартфон должен быть на английском языке, то есть нужно сменить язык, если он у вас на русском.
✦ ChatGPT теперь поселился прямо в айфоне в качестве расширения, наравне с Siri. Я продолжаю использовать оригинальное приложение, так удобнее.
✦ Напоследок потестил Playground (приложение, которое появилось вместе с обновлением OS, прикладываю к посту скрины оттуда). Вот эту штуку вообще лучше бы не выкатывали, Стив Джобс за такое откусил бы руки или еще один кусок яблока. Приложение задумывалось как редактор для создания веселеньких картинок, но на мой взгляд такое могло бы выглядеть весело в 2021 году, при этом качество тоже из 2021 года.
В общем Apple Intelligence не оправдал свою аббревиатуру, по крайней мере пока.
This media is not supported in your browser
VIEW IN TELEGRAM
Давно не было AI-помощников для встреч и коллов, появился любопытный кандидат
Если часто проводите встречи с международными партнерами, можно попробовать Cuckoo – AI-переводчик, который интегрируется в Zoom, Google Meet и Slack.
Он переводит в реальном времени, поддерживает 20+ языков, в том числе русский и учитывает контекст беседы.
#meetings@TochkiNadAI
Если часто проводите встречи с международными партнерами, можно попробовать Cuckoo – AI-переводчик, который интегрируется в Zoom, Google Meet и Slack.
Он переводит в реальном времени, поддерживает 20+ языков, в том числе русский и учитывает контекст беседы.
#meetings@TochkiNadAI
This media is not supported in your browser
VIEW IN TELEGRAM
Что-то мне подсказывает, что через 4-5 лет эти ребята от Boston Dynamics будут совсем не брейк-данс танцевать. 🔫
А пока, конечно, кроме восторга — никаких комментариев.
А пока, конечно, кроме восторга — никаких комментариев.
Кстати, я ж тут лекции новые готовлю по ИИ для ивент-продюсеров в рамках курса.
И вот попросили собрать несколько веселых AI-сервисов, а я и собрал.
Может вам тоже будет любопытно взглянуть, делюсь😎
И вот попросили собрать несколько веселых AI-сервисов, а я и собрал.
Может вам тоже будет любопытно взглянуть, делюсь
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from EVENT MBA | media
Ваня Юницкий, эксперт курса «Нейросети в креативных индустриях», рассказал нам про 8 необычных нейросетей на все случаи жизни⚡️
Уверены, что у тебя был момент, когда что-то из этого могло пригодиться!
1. Debate AI
Здесь можно устроить рэп-баттл или политические дебаты между Аристотелем и Микки Маусом. Debate AI — инструмент для проведения дебатов и дискуссий с историческими личностями в живом и образовательном формате. Позволяет участвовать в наводящих на размышления беседах.
2. Texts From My Ex
Этот инструмент проанализирует твои переписки с бывшими или нынешними партнёрами в iMessage или WhatsApp. Получишь дополнительную информацию об отношениях, рейтинги привязанности, общения, сексуальности и оценку, стоит ли продолжать эти отношения. Будет ли AI на твоей стороне, обсуждая бывших, не уточняется!
3. JokeLub
Пиши ему то, что хотел бы сказать в чате другому человеку, а он превратит это в шутку. Можно использовать в чатах с коллегами или на рэп-баттлах — решать тебе.
4. Фанатам Star Wars
На сайте публикуются прогнозы погоды для планеты Татуин из «Звёздных войн». Разработчики использовали AI, чтобы создать полноценную погодную систему, и теперь ежедневно выводят данные о температуре, влажности, ветре, осадках и положении двух солнц Татуина. Прогноз обновляется автоматически, включая описания погоды, созданные искусственным интеллектом.
5. Ai Comic Factory
Нейросеть для создания комиксов.
Выбирай сам, кто будет в главных ролях и в каком стиле будут представлены супергеройские приключения!
6. Excuse Generator
Генератор оправданий. Если стесняешься попросить ChatGPT придумать отмазку, заходи сюда — сервис сам предложит причины твоего опоздания на встречу.
7. PlayPhrase
Напиши любую фразу, а сервис найдёт её в десятках фильмов и создаст видеоролик.
8. Roast Show
Сервис прожарки Telegram-каналов на основе GPT. Отправляешь ссылку на свой или чужой канал и получаешь развёрнутый разбор. Всё по делу!
#education, пробуй и делись с друзьями!
————
EVENT MBA | media: образование, новости и вдохновение для организаторов мероприятий.
Уверены, что у тебя был момент, когда что-то из этого могло пригодиться!
1. Debate AI
Здесь можно устроить рэп-баттл или политические дебаты между Аристотелем и Микки Маусом. Debate AI — инструмент для проведения дебатов и дискуссий с историческими личностями в живом и образовательном формате. Позволяет участвовать в наводящих на размышления беседах.
2. Texts From My Ex
Этот инструмент проанализирует твои переписки с бывшими или нынешними партнёрами в iMessage или WhatsApp. Получишь дополнительную информацию об отношениях, рейтинги привязанности, общения, сексуальности и оценку, стоит ли продолжать эти отношения. Будет ли AI на твоей стороне, обсуждая бывших, не уточняется!
3. JokeLub
Пиши ему то, что хотел бы сказать в чате другому человеку, а он превратит это в шутку. Можно использовать в чатах с коллегами или на рэп-баттлах — решать тебе.
4. Фанатам Star Wars
На сайте публикуются прогнозы погоды для планеты Татуин из «Звёздных войн». Разработчики использовали AI, чтобы создать полноценную погодную систему, и теперь ежедневно выводят данные о температуре, влажности, ветре, осадках и положении двух солнц Татуина. Прогноз обновляется автоматически, включая описания погоды, созданные искусственным интеллектом.
5. Ai Comic Factory
Нейросеть для создания комиксов.
Выбирай сам, кто будет в главных ролях и в каком стиле будут представлены супергеройские приключения!
6. Excuse Generator
Генератор оправданий. Если стесняешься попросить ChatGPT придумать отмазку, заходи сюда — сервис сам предложит причины твоего опоздания на встречу.
7. PlayPhrase
Напиши любую фразу, а сервис найдёт её в десятках фильмов и создаст видеоролик.
8. Roast Show
Сервис прожарки Telegram-каналов на основе GPT. Отправляешь ссылку на свой или чужой канал и получаешь развёрнутый разбор. Всё по делу!
#education, пробуй и делись с друзьями!
————
EVENT MBA | media: образование, новости и вдохновение для организаторов мероприятий.
Please open Telegram to view this post
VIEW IN TELEGRAM