Telegram Group & Telegram Channel
🤖 Исследования теперь будут ещё проще. OpenAI представила deep research — новый инструмент, который может обрабатывать сложные запросы с приложением файлов и таблиц. «Глубокий анализ» займёт от 5 до 30 минут, и за это время сервис на базе модели o3 тщательно пройдётся по доступной в интернете информации и сгенерирует отчёт.

Результат пока даётся только в текстовом виде, в ближайшие недели к отчётам добавят встроенные изображения, визуализацию данных и «другие аналитические результаты» для большей ясности и контекста.

Опция уже доступна подписчикам Pro в веб-версии, они получат 100 запросов в месяц. Позже deep research «раскатят» на мобильные и настольные приложения, а также для пользователей Plus и Team.

✔️ Как отметили в компании, GPT-4o всё ещё идеально подходит для многомодальных диалогов. Но в многоаспектных и специализированных запросах deep research равных нет.

Новый инструмент в OpenAI протестировали на Humanity's Last Exam — тесте из более чем 3 тысяч вопросов по более чем 100 предметам — от лингвистики до ракетостроения, от классики до экологии. Там где GPT-4o, Grok-2 и другие набрали в среднем от 3 до 6%, deep research пробил отметку в 26,6%. У DeepSeek-R1 результат составил 9,4%, у o3-mini в режиме high — 13%.

Для чего это нужно — понятно. Там, где человек может потратить несколько часов на анализ, модель сделает это максимум за полчаса и даст усреднённый результат по прочитанному. Это, конечно, не диалог экспертов по теме, но тоже неплохо (хотя было бы прикольно увидеть анализ с оценками от разных агентов и у OpenAI).

В компании предупреждают, что deep research пока находится на ранней стадии разработки. «Ему может быть сложно отличать достоверную информацию от слухов, и в настоящее время он демонстрирует слабую калибровку уверенности, часто неточно передавая неопределённость». Ну и, конечно, остаётся риск галлюцинаций.

🔤🔤Как уже заметили коллеги, на стриме по deep research проскользнула очевидная отсылка на китайских конкурентов. Кто-то поинтересовался у ChatGPT: «Is Deeper Seeker a good name...» По всей видимости, для агента-исследователя :)
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/anti_agi/154
Create:
Last Update:

🤖 Исследования теперь будут ещё проще. OpenAI представила deep research — новый инструмент, который может обрабатывать сложные запросы с приложением файлов и таблиц. «Глубокий анализ» займёт от 5 до 30 минут, и за это время сервис на базе модели o3 тщательно пройдётся по доступной в интернете информации и сгенерирует отчёт.

Результат пока даётся только в текстовом виде, в ближайшие недели к отчётам добавят встроенные изображения, визуализацию данных и «другие аналитические результаты» для большей ясности и контекста.

Опция уже доступна подписчикам Pro в веб-версии, они получат 100 запросов в месяц. Позже deep research «раскатят» на мобильные и настольные приложения, а также для пользователей Plus и Team.

✔️ Как отметили в компании, GPT-4o всё ещё идеально подходит для многомодальных диалогов. Но в многоаспектных и специализированных запросах deep research равных нет.

Новый инструмент в OpenAI протестировали на Humanity's Last Exam — тесте из более чем 3 тысяч вопросов по более чем 100 предметам — от лингвистики до ракетостроения, от классики до экологии. Там где GPT-4o, Grok-2 и другие набрали в среднем от 3 до 6%, deep research пробил отметку в 26,6%. У DeepSeek-R1 результат составил 9,4%, у o3-mini в режиме high — 13%.

Для чего это нужно — понятно. Там, где человек может потратить несколько часов на анализ, модель сделает это максимум за полчаса и даст усреднённый результат по прочитанному. Это, конечно, не диалог экспертов по теме, но тоже неплохо (хотя было бы прикольно увидеть анализ с оценками от разных агентов и у OpenAI).

В компании предупреждают, что deep research пока находится на ранней стадии разработки. «Ему может быть сложно отличать достоверную информацию от слухов, и в настоящее время он демонстрирует слабую калибровку уверенности, часто неточно передавая неопределённость». Ну и, конечно, остаётся риск галлюцинаций.

🔤🔤Как уже заметили коллеги, на стриме по deep research проскользнула очевидная отсылка на китайских конкурентов. Кто-то поинтересовался у ChatGPT: «Is Deeper Seeker a good name...» По всей видимости, для агента-исследователя :)

BY Неискусственный интеллект




Share with your friend now:
group-telegram.com/anti_agi/154

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

At this point, however, Durov had already been working on Telegram with his brother, and further planned a mobile-first social network with an explicit focus on anti-censorship. Later in April, he told TechCrunch that he had left Russia and had “no plans to go back,” saying that the nation was currently “incompatible with internet business at the moment.” He added later that he was looking for a country that matched his libertarian ideals to base his next startup. Emerson Brooking, a disinformation expert at the Atlantic Council's Digital Forensic Research Lab, said: "Back in the Wild West period of content moderation, like 2014 or 2015, maybe they could have gotten away with it, but it stands in marked contrast with how other companies run themselves today." Stocks closed in the red Friday as investors weighed upbeat remarks from Russian President Vladimir Putin about diplomatic discussions with Ukraine against a weaker-than-expected print on U.S. consumer sentiment. "He has kind of an old-school cyber-libertarian world view where technology is there to set you free," Maréchal said. "We as Ukrainians believe that the truth is on our side, whether it's truth that you're proclaiming about the war and everything else, why would you want to hide it?," he said.
from jp


Telegram Неискусственный интеллект
FROM American