Telegram Group Search
Голосовой помощник Alexa от Amazon сегодня стал ИИ-агентом с «мозгами» Claude

Сегодня представили обновленную Alexa+ и это не просто голосовой помощник в привычном понимании.

«Мозг» у Alexa от Claude и теперь система способна к более сложным взаимодействиям:

1. может вести диалог с учетом контекста. Те кто пользуются Claude, те понимают качество.

2. адаптироваться к предпочтениям пользователя, благодаря Claude Alexa может стать очень эмпатичной.

3. самостоятельно принимать решения для выполнения задач, таких как заказ продуктов или управление умным домом.
Набиуллина: к цифровому ₽ много замечаний, массовое внедрение откладывается на более поздний срок, чем планировалось

Глава ЦБ Э. Набиуллина заявила, что регулятор получает от отрасли вопросы об объемах необходимых доработок и запросы о сдвиге сроков широкого внедрения цифрового рубля. Ранее ЦБ заявлял, что с 1 июля 2025 года начнется массовое внедрение.

Бизнес, банки и правительство выразили заинтересованность в проведении смарт-контрактов, для которых цифровой рубль предоставляет больше возможностей.

В ЦБ хотят сделать это направление одним из приоритетных в развитии проекта.

Ранее мы писали о проблемах, с которыми столкнулся проект ЦБ.

А здесь был наш анализ о том, почему цифровой рубль не рабочая тема для сегодняшнего и завтрашнего дня.
Сейчас будет просто топовый пост! Это очень крутая разработка!
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
💸Экс-сотрудники Google создали компанию Physical Intelligence (π.com!). Они будут создавать AGI для роботов Им уже на старте венчурные инвесторы отдали $70 млн, в частности такие фонды, как Thrive, Khosla, Lux и Sequoia. Physical Intelligence состоит из…
Ex сотрудники Google дали роботам «внутренний голос», который есть у людей

Новая разработка
Hi Robot от Physical Intelligence превосходит GPT-4o на 40% по точности выполнения инструкций.

Ключевое - у технологии целостностный подход, объединяющий зрительное восприятие, языковое понимание, осознанное рассуждение "внутренним голосом" и действие в единой архитектуре, которая обучается и адаптируется как единое целое.

Представьте, что вы готовите новое блюдо по рецепту. Вы мысленно проговариваете каждый шаг: «сначала нарезать лук, теперь добавить соль...» Этот «внутренний голос» — не интуиция, а осознанное, вербализованное мышление, ключевая часть человеческого разума при решении сложных задач.

Теперь такой же механизм получили роботы от стартапа Physical Intelligence, чья команда состоит из экс- сотрудников Google, основавших в марте 2024 года компанию Physical Intelligence.

Hi Robot (Hierarchical Interactive Robot) — технология, которая позволяет роботам справляться со сложными задачами, разбивая их на простые шаги и адаптируясь к указаниям человека в реальном времени.

Эта технология состоит из:

1. Двухуровневого мышления по модели Канемана.
Система напрямую воплощает знаменитую теорию нобелевского лауреата Даниэля Канемана о двух системах мышления, описанную в его работе «Думай медленно... решай быстро»:

«Система 1» (быстрая, автоматическая, интуитивная) — реализована низкоуровневой моделью π0, которая выполняет конкретные действия без видимых усилий.

«Система 2» (медленная, рассудительная, требующая внимания) — представлена высокоуровневой политикой, которая анализирует задачу, разбивает её на шаги и адаптируется к обратной связи.

Именно эта "Система 2" создаёт тот самый "внутренний голос", который проговаривает сложные задачи, делая их понятными и выполнимыми.

2. Единого фундамента для обоих уровней мышления.

В отличие от конкурентов, Hi Robot использует одну и ту же базовую модель PaliGemma-3B VLM для обоих уровней иерархии, что обеспечивает согласованность и более естественную коммуникацию между уровнями "мышления" робота.

3. Реального понимания контекста.
Система не просто выполняет команды — она понимает их в контексте ситуации. Когда вы говорите роботу «это не мусор» во время уборки стола, Hi Robot понимает, что вы указываете на конкретный объект, который робот в данный момент держит, и корректирует своё поведение.

4. Интеграции знаний из интернета.
Благодаря предварительному обучению на данных из интернета, Hi Robot обладает "здравым смыслом" и общими знаниями о мире. Это позволяет ей лучше реагировать на неожиданные ситуации и интерпретировать расплывчатые команды.

Hi Robot уже протестирован на реальных задачах, например:

Приготовление бутербродов: «Сделай мне бутерброд с сыром и ростбифом, но без помидоров»

Уборка стола: «Убери только мусор, но не посуду» или «Собери только желтоватые предметы»

Покупки в магазине: «Мне нужны чипсы, Oreo и напитки для киновечера»
При этом вы можете вмешиваться в процесс: «Оставь это», «Я хочу также KitKat», «Это не мусор!», и робот адаптируется к вашим указаниям без перепрограммирования.

Технические инновации:

В основе Hi Robot лежат передовые технологии, разработанные Physical Intelligence:
π0 — 1-я универсальная модель управления роботами, аналог GPT для физического мира.

FAST — метод токенизации действий, повышающий точность и скорость обучения в 5 раз.

Сравнение с конкурентами

Hi Robot сильно выделяется среди аналогичных проектов в этой области:
RT-2 (Google DeepMind) — модель vision-language-action, но без явного разделения на высокий и низкий уровни мышления. Hi Robot превосходит её в обработке обратной связи в реальном времени.
SayCan (Google) — использует языковые модели для планирования, но опирается на предопределённые навыки. Hi Robot предлагает более тесную интеграцию зрения и языка.
PaLM-E (Google) — единая сквозная модель без иерархии, что ограничивает её способности к адаптации и рассуждению.
YAY Robot (Stanford) — фокусируется на коррекции ошибок, но имеет более узкие возможности для сложного планирования.
⚡️Квантовая гонка mode on: Amazon представил свой чип

Amazon Web Services представила Ocelot – 1-й квантовый чип компании, основанный на подходе к квантовой коррекции ошибок.

В отличие от традиционных методов, требующих тысяч физических кубитов для создания одного стабильного логического кубита, Ocelot обещает снизить эту избыточность на 90%.

Проект Amazon (Ocelot)
предлагает постепенное масштабирование с фокусом на аппаратную эффективность.

Amazon делает ставку на надежность и эффективность, опираясь на твердую научную базу. Если Ocelot действительно способен снизить требования к физическим ресурсам на порядок, это может сделать масштабирование квантовых компьютеров гораздо более реалистичным в среднесрочной перспективе.

Google (Willow) предлагает:
- 105 кубитов, способных решать задачи, недоступные суперкомпьютерам
- Фокус на практическое квантовое превосходство уже сегодня

Microsoft (Majorana 1):

- Топологические кубиты на основе нового состояния материи
- Потенциал размещения миллиона кубитов на одном чипе
- Наиболее амбициозный подход с высокими рисками и потенциально высокой отдачей

Квантовая гонка обостряется, и каждый из технологических гигантов выбрал свой путь.
Стейблкоины+ИИ - база нового финансового ландшафта, пишут основатели Stripe в своем годовом письме

Братья Коллинс, которые являются сегодня вместе со своим Stripe главными трендсеттерами финансовой трансформации мира описали то, что уже происходит и будет происходить с миром финансов.

По данным платёжной компании Stripe, 2 силы перестраивают всю архитектуру экономики: стейблкоины и ИИ.

Масштабная реформа рынка капитала no sexy, но она необходима.

Стейблкоины — это новая ветвь денежного дерева
. Они обладают 4 ключевыми преимуществами:

1. Делают транзакции дешевле
2. Делают их быстрее
3. Глобально доступны сразу
4. Полностью программируемы

За год объем их транзакций удвоился, достигнув 40 млн активных кошельков.

Stripe говорит, что они уже ведут переговоры с крупнейшими мировыми компаниями, помогая им разрабатывать стратегии использования стейблкоинов для глобального расширения и хранения средств.

Экономика ИИ -беспрецедентный рост.

Стартапы в сфере ИИ достигают невиданных темпов роста.
1. Cursor достиг $100млн дохода за 3 года,

2. Lovable — $17млн за 3 месяца,

3. Bolt — $20 млн за 2 месяца.

Самое интересное — эволюция от горизонтальных решений к вертикальным. Как SaaS прошел путь от универсальных платформ (Salesforce) к отраслевым (Toast), так и ИИ движется от ChatGPT к специализированным инструментам.

2
важные тенденции формируют будущее:

1. ИИ-агенты меняют коммерцию. 700+ стартапов уже запущено на платформе Stripe, где ИИ-агенты сами совершают покупки через виртуальные карты, а пользователи программно контролируют авторизации.

2. Вертикальный SaaS делает технологии будущего доступными малому бизнесу. Это особенно важно, учитывая что исследования показывают: крупные фирмы традиционно быстрее внедряют инновации.

Компании, которые сегодня осваивают стейблкоины и ИИ, получат завтра решающее преимущество. А интернет-нативные, программируемые финансовые услуги станут фундаментом новой экономики.
OpenAI выпустила новую модель GPT-4.5, чья база знаний ограничена октябрем 2023 года. Вот, что нужно знать о ней

В отличие от недавних ИИ-моделей, ориентированных на рассуждения (o1, o3-mini), GPT-4.5 превосходит в задачах, требующих "мягких навыков", творчества и широких знаний, а не математики или программирования.

Ключевые особенности:
Модель обучалась на огромных мощностях, что даже у компании закончились GPU: 10-кратное увеличение вычислительных ресурсов по сравнению с GPT-4. Для обучения использовались несколько датацентров одновременно.

Стоимость - $75 за млн токенов на входе и $150 за миллион на выходе – в 15-30 раз дороже GPT-4o.

Производительность и контекст генерация заметно медленнее предшественников, длина контекста осталась на уровне 128K токенов. База знаний ограничена октябрем 2023 года.

Функциональность Поддерживает Canvas, поиск и загрузку файлов. Пока не имеет мультимодальных функций типа голосового режима или видео.

Уже доступна Pro-пользователям и разработчикам всех API-тиров
На следующей неделе появится для Plus-подписчиков ($20)
OpenAI планирует добавить "десятки тысяч GPU" на следующей неделе для расширения доступа.

Результаты независимых бенчмарков - Aider Polyglot Coding Benchmark: GPT-4.5 Preview существенно превосходит своего предшественника, но уступает специализированным моделям:
Claude 3.7 Sonnet с режимом мышления (32k токенов) — 65%
Claude 3.7 Sonnet без режима мышления — 60%
DeepSeek V3 — 48%
GPT-4.5 Preview — 45%
ChatGPT-4o — 27%
GPT-4o — 23%
Бизнес консалтингу конец. Теперь их работа - ПО. ИИ-агенты, заточенные под конкретные задачи и исследования забирают их кусок пирога

Услуги, которые всего пару лет назад могли предоставить только консультанты McKinsey за огромные деньги теперь доступны через ПО на базе ИИ по цене месячной подписки на Netflix. Уже сегодня есть Deep Research от OpenAI, у Google и Anthropic свои аналогичные продукты. Их сегодняшний минус в том, что нет доступа к данным компаний.

Но стартапы уже решают эту задачу. You.com представили Advanced Research & Insights (ARI) - это ИИ, агент, который за 5 минут вместо недель работы команды консультантов от McKinsey/BCG/KPMG сделает для вас работу.

Одновременный анализ 400 источников (в 10 раз больше конкурентов).

$100,000+ экономия на каждом исследовательском проекте.

Профессиональное форматирование, визуализации и кликабельные цитаты.

Более того Perplexity собираются сделать 4 конкретных продукта:

1. Консультант «McKinsey» как программное обеспечение

2. Венчурный инвестор как программное обеспечение

3. Аналитик финансового планирования и анализа как программное обеспечение

4. Юридическое/комплаенс-обеспечение как программное обеспечение

По сути, ИИ-инструменты заменят функции дорогостоящих специалистов (консультантов, инвесторов, аналитиков, юристов), автоматизируя их работу с помощью технологий глубоких исследований и ИИ.
Создана 1-я генетическая ИИ-модель, связывающая геномы с заболеваниями на молекулярном уровне.

GSK в сотрудничестве с учеными из Harvard Medical School, Max Planck Institute и University of Oxford представили Phenformer.

Phenformer создает многоуровневую карту связей между вашей ДНК, экспрессией генов в различных типах клеток и риском развития заболеваний.

Phenformer создавался не с нуля, а использовал уже существующую модель Enformer от DeepMind в качестве фундаментального компонента своей архитектуры.

Модель анализирует последовательности ДНК длиной до 88 миллионов пар оснований – почти в 100 раз больше, чем существующие генетические модели.

Для разработки Phenformer использовались данные секвенирования целых геномов 150 076 человек из UK Biobank.

Ключевые достижения:

1. Расшифровка скрытых механизмов заболеваний
Phenformer обнаружил неочевидные связи между генетическими вариациями и болезнями.

2. Превосходная точность прогнозирования. Модель превосходит существующие методы предсказания индивидуального риска заболеваний на 4,2% в смешанных популяциях и на 11,2% в неевропейских группах.

3. Молекулярная стратификация пациентов Phenformer выявляет генетические подтипы заболеваний, объясняющие различную предрасположенность к сопутствующим патологиям.

4. Биологически обоснованная архитектура. Phenformer имитирует биологический принцип передачи информации: ДНК → клеточный контекст → экспрессия генов → заболевание.

Эта технология открывает путь к персонализированной медицине нового уровня:

- Разработка более точных средств диагностики и предсказания риска заболеваний
- Более глубокое понимание молекулярных механизмов болезней
- Выявление новых терапевтических мишеней
- Разработка лекарств, нацеленных на конкретные молекулярные подтипы заболеваний
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
⚡️Частная космическая компания Intuitive Machines первые в истории высадили коммерческий космический корабль на Луну
⚡️2-я в истории частная космическая компания высадилась на Луне успешно

Компания Firefly Aerospace стала второй частной компанией, осуществившей успешную посадку на Луну.

Их аппарат Blue Ghost успешно приземлился в районе Море Кризисов сегодня, следуя за первопроходцем Intuitive Machines, чей аппарат Odysseus совершил историческую первую коммерческую посадку в феврале 2024 года.

Blue Ghost Mission 1 доставил на лунную поверхность 10 научных и технологических инструментов в рамках программы NASA "Коммерческие услуги по доставке полезной нагрузки на Луну" (CLPS).

На фото их первый снимок Луны.

Научная миссия Blue Ghost рассчитана на полный лунный день (примерно 14 земных дней) и включает уникальные эксперименты:

- Тестирование сбора образцов лунного реголита
- Исследование возможностей навигации с использованием GPS
- Изучение радиационно-устойчивых вычислений
- Разработка методов снижения воздействия лунной пыли

Практическая ценность миссии
для освоения космоса
:

- Изучение лунного реголита поможет разработать технологии добычи ресурсов на Луне, включая воду и кислород для будущих лунных баз.

- Понимание поведения лунной пыли также критически важно для долговременных миссий.

Для земных технологий:

- Разработки в области радиационно-устойчивых вычислений найдут применение в медицинском оборудовании и транспортных системах на Земле.

- Новые пылеотталкивающие материалы могут привести к созданию улучшенных покрытий для солнечных панелей и электроники.

Для улучшения навигации:

Тестирование GPS на Луне поможет усовершенствовать точность навигационных систем на Земле, а автономные технологии посадки улучшат беспилотные системы и самоуправляемый транспорт.

Для защиты инфраструктуры: Исследования космической погоды и солнечного излучения помогут лучше защищать земные спутники и электросети от солнечных вспышек.

Для экономики

Успешная демонстрация коммерческой доставки грузов на Луну открывает дорогу для развития лунной экономики, снижения стоимости космических миссий и стимулирования инноваций.

Эти все про начало новой эры в космических исследованиях, где частные компании играют всё более значимую роль в освоении Луны и продвижении человечества к постоянному присутствию на нашем естественном спутнике.
Трамп поручил создать гос крипто резерв из BTC, XRP, SOL и ADA

В своем посте он обозначил, что резерв может включать BTC(биткоин), XRP(Ripple), SOL (Solana) и ADA (Cardano), а также заявил о намерении сделать США "криптовалютной столицей мира".

Ранее мы писали о том, что сын Трампа лоббирует эти криптовалюты для национального резерва.

А тут план Америки по криптовалютам.

Что означает такой расклад криптовалют, разбираем ниже:

Для экономики США - означает привлечение инвестиций в криптоиндустрию. Однако реализация резерва и его состав пока не определены, что создает неопределенность.

Для мировых финансов-может усилить конкуренцию с другими странами, такими как Китай, ЕС, и повлиять на волатильность рынка. XRP, SOL и ADA могут вырасти в цене, но это зависит от дальнейших действий рабочей группы.

Для инвесторов - упоминание этих криптовалют может повысить интерес, но риски спекулятивных пузырей и нестабильности остаются.

Рабочая группа, возглавляемая Дэвидом Саксом (крипто- и ИИ-царем), должна представить рекомендации к июлю 2025 года. Пока это только планы, и детали реализации остаются неясными.
Итоги уходящей недели, то, что имеет значение в России и мире:

Искусственный интеллект

1. Йошуа Бенджио предложил альтернативу ИИ-агентам — Scientist AI.

2. Anthropic выпустила Claude 3.7 Sonnet — модель с пошаговыми рассуждениями и визуализацией данных. Также компания привлекла $3,5 млрд при оценке $61,5

3. DeepSeek снизила цены и открыла код новых технологий, а
OpenAI расширила доступ к Deep Research для всех платных пользователей и выпустила GPT-4.5. Также DeepSeek разработала свою файловую систему для обучения ИИ-моделей

4. Perplexity запускает браузер "Comet" , а инвесторы оценивают стартап уже в $15млрд.

5. Экс- сотрудники Google создали"внутренний голос", уже психология появляется у роботов

6. Factory AI объединила ИИ с человеческим опытом на всех этапах разработки ПО

7. Google запустил бесплатную версию Gemini Code Assist глобально

8. Hugging Face представил FastRTC для работы с голосом и звонками

9. Команда Яна ЛеКуна разработала новый прорывной метод обучения ИИ

10. Alibaba представила Wan2.1 — продвинутые ИИ-модели для видео

11. Amazon обновила Alexa, интегрировав технологии Claude

12. Эксперимент: 2 ИИ-агента во время звонка распознали друг друга и перешли на протокол свой собственный язык общения

13. Экосистема ИИ в Индии.

Финансы и криптовалюты

14
. Дубай признал стейблкоины USDC и EURC

15. Трамп поручил создать государственный криптовалютный резерв из BTC, ETH, XRP, SOL и ADA. Уже 18 штатов США рассматривают создание биткоин-резервов.

16. Bank of America готовится выпустить собственный стейблкоин

17. Набиуллина: массовое внедрение цифрового рубля откладывается

18. Stripe: стейблкоины и ИИ — основа нового финансового ландшафта

19. Ethena привлекла $100 млн для создания новой блокчейн-сети

Бизнес и ИИ-агенты

20.
ИИ-агенты и платежи: как бизнес применяет их на практике

21. Бизнес консалтеров превращается в ПО-You.com представил ARI — ИИ-агент, делающий работу команды консультантов за 5 минут.

22. 700+ стартапов на платформе Stripe используют ИИ-агентов для совершения покупок

Робототехника, чипы и инвестиции

23
. Свежий отчет от Morgan Stanley, где акцент на лидерстве Китая в "теле" роботов, а США в "мозге", с Tesla как ключевым интегратором.

24. Apple инвестирует $500 млрд в ИИ, Alibaba — $52 млрд. Microsoft отказался инвестировать в проект OpenAI Stargate

25. Huawei увеличила выход годных ИИ-чипов до 40%, сокращая отставание от Nvidia

26. Amazon представила 1-й квантовый чип Ocelot.

27. Китайцы представили BEAMDOJO для обучения роботов

Наука и космос

28.
Firefly Aerospace стала второй частной компанией в истории, которая высадилась на Луну.

29. Сооснователь "Моторики" инвестирует ₽100 млн в биореактор для Луны

Биотехнологии

30.
Arc Institute запустил самый большой на сегодняшний день виртуальный клеточный атлас из 300 млн клеток

31. GSK создала Phenformer — первая ИИ-модель, связывающую геномы с заболеваниями человека

31. ROCKET: улучшение для AlphaFold для интеграции кристаллографических данных.
₽305 млн российский разработчик нейроинтерфейсов Elvis получил от фонда Восход,

Для Elvis - это хороший буст, но деньги маленькие. Компания разрабатывает 4 продукта: импланты для восстановления слуха и зрения, устройство для стимуляции мозга, а также интерфейс «мозг-компютер».

Все разработки планируют вывести на российский рынок в течение 4-х лет. В частности, имплант для восстановления зрения сейчас испытывают на обезьянах, ориентировочно в 2026-м собираются начать тесты с добровольцами.

Фонд Восход получил долю в капитале Elvis, по данным«Контур Фокуса», с 23 января 2025 года «УК Восход» владеет долей 35% в ООО «Нейроимпланты Элвис». Таким образом оценка разработчика составила около 870 млн рублей.

₽305 млн рублей — не огромная сумма по меркам глобальных игроков вроде Science, Synchron, Neuralink, но для российского стартапа это хоть что-то.

Например, компания Science Макса Ходака тоже делает импланты (проект
Science Eye), но с упором на стимуляцию сетчатки, а не коры, плюс исследования в области генной инженерии.

Science Eye уже показал результаты — 32 из 38 пациентов с макулярной дегенерацией начали видеть лучше благодаря микроLED-импланту (16 000 пикселей) на сетчатке. Это не классические электроды, а световая стимуляция с оптогенетикой. Их биогибридный BCI (миллион нейронов, миллиарды синапсов) пока на ранней стадии, но обещает революцию. Инвестиции в проект - $160 млн.

Проект Blindsight, анонсированный Маском, также нацелен на восстановление зрения через электроды (1024 в текущей версии) в зрительной коре. Успехи пока только на животных, но первая операция на человеке (2024) уже была. Масштаб амбиций огромен, как и финансирование — $680 млн.

Neuralink ($680 млн), Blackrock Neurotech ($200 млн от Tether), Synchron ($145 млн от Гейтса и Безоса), Science Corp ($160 млн) — это миллионы $ от VC и миллиардеров.

Китайский StairMed в феврале 2025 собрал рекордные для КНР $48 млн, обойдя NeuroXess (~$40 млн в 2022).

Общий тренд - венчурный капитал в BCI растет, перекрывая даже DARPA — только в 2024 западные стартапы привлекли сотни миллионов.

Elvis Tech с их 47 электродами и ₽305 млн пока скромнее — это локальный проект с потенциалом. Для прорыва им нужны не только деньги, но и переход к людям.
Все о блокчейн/мозге/space/WEB 3.0 в России и мире
Трамп добавил, что в гос резерв криптовалют США войдут биткоин и эфир, конечно О других монетах тут.
7марта Трамп проведет 1-й саммит White House Crypto, как говорит его советник Дэвид Сакс, там планируются важные объявления по поводу:

1. Создания национального крипторезерва, о котором вчера было объявлено.
2. Планах США по внедрению и развитию крипты.

Но в сообществе настроения разделились, например, сооснователь BitMEX, Артур Хейс высказал скептическое мнение о создании крипторезерва США.

Он считает, что анонс Дональда Трампа пока остается лишь словами, потому что для реализации такого плана нужны конкретные финансовые механизмы — например, одобрение Конгресса на заимствование средств или переоценка золота, чтобы получить деньги на покупку криптовалют, таких как биткоин и альткоины. Без этого, по его мнению, у правительства просто нет ресурсов для таких масштабных приобретений.

Тем не менее, Хейс сохраняет долгосрочный оптимизм по поводу будущего криптовалют, хотя и отметил, что сейчас не планирует увеличивать свои вложения.

Это отражает настроения части сообщества: многие ждут конкретных шагов, а не только громких заявлений. С другой стороны, рынок уже отреагировал ростом — биткоин поднялся на 8%, а некоторые альткоины, вроде XRP, показали еще более впечатляющий скачок.

Ближайший саммит по криптовалютам в Белом Доме 7 марта может дать больше ясности — там, возможно, раскроют детали финансирования и реализации. А пока это смесь надежд, сомнений и рыночного ажиотажа.
Google делают из Gemini универсального ИИ-агента, теперь можно задавать вопросы через видео

Google представили новые функции, такие как Screenshare и возможность задавать вопросы через видео, Gemini может обрабатывать не только текст, но и визуальную информацию в реальном времени — будь то содержимое экрана или окружающий мир через камеру.

Это делает его более универсальным, так как он "видит" и "понимает" контекст, подобно человеку.

Ещё в декабре 2024 года Google представила Project Marinerа — прототип ИИ-агента на базе Gemini, который способен автономно управлять браузером, кликать по кнопкам, заполнять формы и выполнять задачи в интернете. Это шаг к "agentic AI" — системам, которые не просто отвечают, а действуют от имени пользователя.

Project Astra - ещё один прототип, позиционируется как универсальный помощник, который может давать советы, отвечать на вопросы о том, что видит через камеру, и даже работать с такими инструментами, как Google Search и Maps. Обновления в Gemini 2.0, включая улучшенную память и диалог на нескольких языках, усиливают эту универсальность.

Вторая функция, которая была представлена позволяет снимать видео и задавать вопросы Gemini прямо во время съемки. Google анонсировала эту возможность еще на Google I/O в прошлом году, и теперь она становится реальностью.

Обе функции будут доступны пользователям подписки Gemini Advanced (в рамках плана Google One AI Premium) на устройствах Android. Развертывание начнется позже в марте 2025 года.
Анализ и карта рынка ИИ-агентов и их инфраструктуры-исследование Madrona Venture

Madrona отмечают фундаментальные изменения в технологической индустрии, вызванные стремительным развитием ИИ-агентов.

Ключевые показатели революции ИИ-агентов
ИИ-агенты создают базы данных на платформе Neon в 4 раза быстрее, чем разработчики-люди. Библиотека автоматизации UI Stagehand от Browserbase превысила 500 тысяч ежемесячных npm-установок.Когда Create.xyz запустил своего агента на базе Neon, было создано 20,000 новых баз данных за 36 часов.

Новая экономика стартапов
Команда из 20 человек теперь может генерировать $100 млн годового дохода за менее чем два года. Компании Cursor, Bolt, Lovable и Mercor разрушают традиционные правила масштабирования.

3 определяющих слоя инфраструктурного стека

1. Слой инструментов: Расширение возможностей агентов

2. Слой данных: Память в масштабе

3. Оркестрация: Управление сложностью

Эта трансформация имеет далеко идущие последствия:

Фундаментальное изменение в разработке ПО — агенты не просто улучшают существующие процессы, а создают новую парадигму.

Снижение барьеров входа — конечные пользователи могут создавать сложные системы простым описанием желаемого результата.

Новые возможности для инвесторов и основателей — формирование инфраструктуры агентов создает многочисленные ниши для инноваций.

Ключевой выбор для каждого основателя — адаптироваться к трансформирующей силе ИИ или рисковать отстать от конкурентов.

Как отмечает Джон Туроу из Madrona Venture Group, "мы наблюдаем не просто впечатляющие показатели роста, а появление новой парадигмы разработки программного обеспечения."
Microsoft представили 1-ого голосового ИИ-агента для здравоохранения

Microsoft представила Dragon Copilot — 1-й в отрасли здравоохранения унифицированный голосовой ИИ-помощник, который объединяет возможности Dragon Medical One (технология, которая позволяет надиктовывать медработнику информацию и создавать заметки с помощью голосовых команд) и DAX Copilot (технология, которая может транскрибировать услышанное в текст).

Агент позволяет медицинским работникам:

1. автоматическое создание заметок с помощью функции распознавания речи, поддержка нескольких языков, персонализированные стили и форматирование.

2. получать информацию: встроенный ИИ-помощник для поиска медицинской информации из надежных источников.

3. автоматизировать задачи: такие как создание заказов, составление заметок, написание направлений и резюме после посещений.

Dragon Copilot будет доступен в США и Канаде в мае, затем в Великобритании, Германии, Франции и Нидерландах.

Ранее про рынок голосовых ИИ-агентов мы писали здесь и здесь.
Чат-бот Маска Grok в режиме голосового прослушивает вас даже, когда приложение закрыто

Как это выглядит на практике: вы закрыли приложение на телефоне и читаете книгу вслух, все это время Grok вас слышит, и если время от времени ему задавать вопросы по книге, он начнет вам отвечать.

То есть функция находится в режиме ожидания команд от пользователя и активируется, когда пользователь обращается к нему напрямую.

С одной стороны, такие устройства/приложения с голосовой активацией технически должны непрерывно "слушать", чтобы распознать команду - это часть их функциональности, микрофон всегда активен.

С другой стороны, это создает потенциальные риски для конфиденциальности:

- Данные могут записываться без полного осознания пользователем.

- Возможен непреднамеренный сбор личной информации.

- Неясно, как долго и где хранятся аудиоданные.

- Как эти данные используются и кто имеет к ним доступ.
Андрей Карпаты:сегодня нет нормального способа проверить, как хорошо работают новые ИИ-модели

Андрей Карпаты, который покинул OpenAI в прошлом году, говорит, что сейчас сложно понять, насколько хороши новые ИИ-модели (типа GPT-4.5).

Он жалуется, что нет нормального способа их проверить. Старые тесты (например, MMLU) уже устарели и не показывают реальную картину. Новые тесты (типа SWE-Bench) слишком узкие и тоже не дают полной оценки. Есть ещё площадка Chatbot Arena, где модели сравнивают, но она уже не очень работает, потому что разработчики специально "подгоняют" свои ИИ под неё, и результаты получаются необъективными.

Карпаты сам пробовал оценивать модели "на глаз" ,по ощущениям, но признаёт, что это ненадёжно, потому что можно обмануться своими ожиданиями или взять слишком мало примеров.

В итоге он говорит: "Я не знаю, как правильно проверить, что эти ИИ умеют на самом деле". Это проблема не только для него, а для всей сферы ИИ прямо сейчас (на март 2025 года).
2025/03/03 21:53:18
Back to Top
HTML Embed Code: