Telegram Group Search
This media is not supported in your browser
VIEW IN TELEGRAM
Ровно год назад мой друг Руслан рассказывал мне про идею ИИ-агента, который будет сидеть в браузере и выполнять рутинные действия. И вот, Опера придумала практически то же самое!

Ребята представили (ну типа в видео превью) Browser Operator - ИИ-агента, который понимает инструкции на человеческом языке и выполняет за вас задачи прямо в браузере. Концепт простой, но потенциально меняющий правила игры. Вы даёте указания - он делает.

Что можно поручить такому оператору? Да практически всё:
- Заказать продукты для конкретного блюда
- Найти и купить те самые носки из мериносовой шерсти (которые вы давно хотели)
- Забронировать путешествие мечты


При этом, вы всегда можете вмешаться и взять управление на себя. Нормальный баланс автоматизации и контроля. Считаю идею весьма перспективной!

Сергей Булаев AI 🤖 - об AI и не только
Новый Hedra Character-3 — первая омнимодальная модель, которая одновременно думает в тексте, картинках и звуке.
Собрали всё в одном: text-to-video, audio-to-video, генерация персонажей с сохранением стиля, динамические фоны. Прямотаки новая ступень эволюции видеогенерации.

Надо тестить самому! Сколько осталось инфлюенсерам?

Сергей Булаев AI 🤖 - об AI и не только
#КриповаяСуббота

Пока мы возимся с моделями ИИ, Cortical Labs зарелизили нечто ИНОЕ - CL1, первый в мире коммерчески доступный биологический компьютер на живых (искуственно выращенных) человеческих нейронах. И это не лабораторный эксперимент - они реально продают эти штуки по $35,000!

Самое удивительное здесь - "тело-в-коробке" (пророчество великого классика начинает сбываться) для этих нейронов. В CL1 встроена миниатюрная система жизнеобеспечения со всем необходимым для поддержания клеток в живом состоянии до шести месяцев - регулирование кислорода, доставка питательных веществ, удаление отходов и поддержание идеальной температуры 37°C. Никаких внешних инкубаторов не требуется!

Что же умеют эти био компьютеры? Они освоили игру в Pong всего за несколько часов - то, на что обычным моделям ИИ потребовалось бы гораздо больше времени. Нейроны могут невероятно быстро перестраивать свои связи, что делает их идеальными для обучения с подкреплением.

Стойка из 30 устройств CL1 потребляет всего 850-1000 ватт. Для сравнения, обучение модели типа GPT-3 требует около 1,300 МЕГАВАТТ-часов. Это разница в несколько порядков! Человеческие нейроны просто обрабатывают информацию гораздо эффективнее кремния.

Применения просто сумасшедшие - от тестирования лекарств от Альцгеймера на нейронах, полученных от реальных пациентов (вместо использования животных моделей), до создания роботов, которые могут адаптироваться к окружающей среде в реальном времени. Исследователи могут наблюдать, как нейроны формируют связи в реальном времени с помощью флуоресцентной микроскопии.

Конечно, эта технология поднимает и этические вопросы. Cortical Labs настаивает, что эти нейронные сети не обладают сознанием, но всё равно создали этический комитет и внедрили защитные механизмы, которые отключают систему, если нейронная сложность превышает определенные уровни. Лучше перестраховаться, когда имеешь дело с клетками человеческого мозга!

Что дальше? Они уже работают над объединением нескольких устройств CL1 в серверные стойки и движутся в сторону создания "Минимально Жизнеспособных Мозгов" с 3D-нейронными структурами. Границы между биологией и технологией становится всё более размытой.

Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Играю в Hedra Character 3, глючит жёстко, отказывается от генераций постоянно. С ошибками и без. Просто не создаёт и всё. Но иногда что то прикольное выходит. Хотелось бы стабильности для экспериментов.

Сергей Булаев AI 🤖 - об AI и не только
Смотрите, первый в мире ИИ-инвестор, выписывает чек на $100k! Зовут её No Cap. 🚫🧢

Основатель Wonder Family Артём Голдман получил подписанный SAFE и деньги. На финальном звонке No Cap управилась за 3 минуты: подписала документы, перевела $100k, познакомила с пятью новыми инвесторами и даже подкинула контакт потенциального сотрудника. Эффективность - огонь!

Я в прошлом году убил десятки часов на общение с инвесторами, и продолжаю тратить 2-3 в неделю. А тут - раз, и за 3 и готово!

No Cap обучали на более чем 60 выпускниках Y Combinator (сами ребята тоже оттуда), и они называют себя "No Cap Mafia". На звонке, она говорит, что не собирается на Burning Man, и вообще общаться с ней можно 24/7, но только если сам фаундер этого захочет.

Готовимся к следующему уровню: ИИ инвестор встречает ИИ фаундера.

UPD: Внезапно понял что как то не раскрыт вопрос как ей позвонить и передать данные для ваера :)

Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Новый Responses API от OpenAI

OpenAI выкатили новый Responses API - объединение Chat Completions и Assistants API! Наконец-то не нужно выбирать между простотой использования и функциональностью.

Что в нём клёвого:
- Объединяет возможности обоих API в один интерфейс
- Упрощает интеграцию инструментов по сравнению с Assistants API
- По умолчанию сохраняет историю чата (бесплатно на 30 дней)
- Можно включить режим без состояния (как Chat Completions)


Для тех, кто уже вложился в Assistants API - без паники! OpenAI обещает целый год на миграцию с полной поддержкой, включая перенос assistant-подобных объектов, code interpreter и вебхуков.

Responses API доступен уже сейчас всем разработчикам и работает со стандартными тарифами на токены и инструменты.

Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Разработчики Luma AI забили очередной гвоздь в крышку гроба диффузии. Их новый подход, Inductive Moment Matching (IMM), вроде бы решает фундаментальные ограничения текущих моделей генерации.

Интересно тут что проблема застоя в ИИ не в нехватке данных, а в отсутствии алгоритмических инноваций. IMM позволяет генерировать контент за несколько шагов вместо десятков итераций, что просто подрывает представления о скорости генерации.

Этот всё заметно упрощает создание приложений использующих генерацию в реальном времени.

Сергей Булаев AI 🤖 - об AI и не только
Google выпустил Gemma 3 – новую линейку мультимодальных моделей, которые работают как с текстом, так и с изображениями. Поддержка видео пока отсутствует :))

В линейке четыре модели: 1B, 4B, 12B и 27B параметров. Самое интересное, что даже младшая 4B версия уже обходит по качеству старшую Gemma 2 с 9B параметров. А 27B-модель вообще творит чудеса – на EQ-Bench она заняла второе место в категории креативного письма.

Технические характеристики:
- Контекстное окно: 128K токенов для крупных моделей и 32K для 1B
- Выходной контекст: до 8192 токенов
- Рейтинг ELO на Chatbot Arena: 1338 (выше DeepSeek V3 671B)
- VRAM для 27B модели: примерно 45GB


На практике есть несколько нюансов:
- Есть проблемы с обещанной поддержкой tool calling
- Модели часто крашатся в
ollama
- Некоторые платформы (например, Transformers) пока не распознают архитектуру
- На AIstudio наблюдаются проблемы с вводом изображений для gemma-3-27b-it


В поведении пользователи отмечают сходство 27B-модели с Sonnet 3.7 – она даёт подробные ответы даже на простые вопросы. Есть интересные наблюдения, что модель иногда "знает" информацию после своей предполагаемой даты отсечки 2021 года.

Так же появился Gemmaverse - портал с кейсами и проектами использующими модель.

Все модели уже доступны на Google AI Studio и Hugging Face, а также добавлены в Ollama. Для использования в своих проектах стоит обратить внимание на двойные BOS-токены при деплое.

Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Свежая партия из 170+ стартапов зимнего набора YC 2025 уже на подходе! В этот раз подборка особенно сильная - и основатели с видением, и технологии на острие. Вот несколько отборных проектов:

Mastra: TypeScript-фреймворк для создания ИИ-агентов. Вот вам NotebookLM на его базе.

Browser Use: Открытый веб-агент с 40 тысячами звёзд на GitHub. Есть даже интерфейс. (на приложенном видео)

Edexia: ИИ-ассистент для проверки учебных работ.

Harper: Страховой брокер с нативной ИИ-интеграцией.

Artificial Societies: ИИ для симуляции целых человеческих сообществ (Представьте что ваш пост завирусился до того как вы его выложили).

Onlook: позволяет визуально редактировать ваши React-сайты или веб-приложения и вносить изменения в код в режиме реального времени. Типа Cursor для дизайнеров.

A1Base: API для предоставления ИИ-агентам телефонного номера, электронной почты и надёжной идентификации. "Twilio для ИИ-агентов"

Misprint, Inc.: "Robinhood для карточек Покемон" (да, серьёзно!)

assistant-ui: Опенсорсная React.js библиотека для ИИ-чатов. Красивая.

Adam: самый быстрый способ превратить идеи в реальность. Опишите ваш прототип, и он появятся на свет. ИИ-инструменты для проектирования САПР

a0.dev: Создание мобильных приложений с помощью ИИ "за минуты"

Mosaic: Команда ИИ агентов для редактирования видео

Trata: ИИ база данных инвестиционных исследований от анонимных аналитиков хедж-фондов - крупнейшая в мире.

Сергей Булаев AI 🤖 - об AI и не только
Media is too big
VIEW IN TELEGRAM
Часть 1.

Текст - новая модель OpenAI, перевод - Claude, озвучка - Elevenlabs, изображение - Flux, ракурсы - новая гемини, которая редактирует картинки промтами ну и видео - Hedra Character 3.

Сергей Булаев AI 🤖 - об AI и не только
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Так, у нас новая рубрика - подкаст #СкорбнаяПятница с Васей в главной роли.

Первый выпуск о свежих новостях прошедшей недели.

Генерировалось почти полностью автоматически. Единственное, Hedra Charcter 3 не досупна пока через API, потому пришлось использовать вторую.

Сергей Булаев AI 🤖 - об AI и не только
2025/06/14 21:48:22
Back to Top
HTML Embed Code: