Неискусственный интеллект

🤖 Исследования теперь будут ещё проще. OpenAI представила deep research — новый инструмент, который может обрабатывать сложные запросы с приложением файлов и таблиц. «Глубокий анализ» займёт от 5 до 30 минут, и за это время сервис на базе модели o3 тщательно пройдётся по доступной в интернете информации и сгенерирует отчёт.

Результат пока даётся только в текстовом виде, в ближайшие недели к отчётам добавят встроенные изображения, визуализацию данных и «другие аналитические результаты» для большей ясности и контекста.

Опция уже доступна подписчикам Pro в веб-версии, они получат 100 запросов в месяц. Позже deep research «раскатят» на мобильные и настольные приложения, а также для пользователей Plus и Team.

✔️ Как отметили в компании, GPT-4o всё ещё идеально подходит для многомодальных диалогов. Но в многоаспектных и специализированных запросах deep research равных нет.

Новый инструмент в OpenAI протестировали на Humanity's Last Exam — тесте из более чем 3 тысяч вопросов по более чем 100 предметам — от лингвистики до ракетостроения, от классики до экологии. Там где GPT-4o, Grok-2 и другие набрали в среднем от 3 до 6%, deep research пробил отметку в 26,6%. У DeepSeek-R1 результат составил 9,4%, у o3-mini в режиме high — 13%.

❓ Для чего это нужно — понятно. Там, где человек может потратить несколько часов на анализ, модель сделает это максимум за полчаса и даст усреднённый результат по прочитанному. Это, конечно, не диалог экспертов по теме, но тоже неплохо (хотя было бы прикольно увидеть анализ с оценками от разных агентов и у OpenAI).

В компании предупреждают, что deep research пока находится на ранней стадии разработки. «Ему может быть сложно отличать достоверную информацию от слухов, и в настоящее время он демонстрирует слабую калибровку уверенности, часто неточно передавая неопределённость». Ну и, конечно, остаётся риск галлюцинаций.

🔤

🔤Как уже заметили коллеги, на стриме по deep research проскользнула очевидная отсылка на китайских конкурентов. Кто-то поинтересовался у ChatGPT: «Is Deeper Seeker a good name...» По всей видимости, для агента-исследователя :)

Please open Telegram to view this post

VIEW IN TELEGRAM

YouTube

Introduction to Deep Research

Mark Chen, Josh Tobin, Neel Ajjarapu, and Isa Fulford introduce and demo deep research from Tokyo.

www.group-telegram.com/us/anti_agi.com/154

502 viewsИлья Склюев, Feb 3 at 09:14

group-telegram.com/anti_agi/154

Create: 2025-02-03
Last Update: 2025-02-21 23:02:47

Telegram | DID YOU KNOW?

🤖 Исследования теперь будут ещё проще. OpenAI представила deep research — новый инструмент