Telegram Group & Telegram Channel
🤖 Исследования теперь будут ещё проще. OpenAI представила deep research — новый инструмент, который может обрабатывать сложные запросы с приложением файлов и таблиц. «Глубокий анализ» займёт от 5 до 30 минут, и за это время сервис на базе модели o3 тщательно пройдётся по доступной в интернете информации и сгенерирует отчёт.

Результат пока даётся только в текстовом виде, в ближайшие недели к отчётам добавят встроенные изображения, визуализацию данных и «другие аналитические результаты» для большей ясности и контекста.

Опция уже доступна подписчикам Pro в веб-версии, они получат 100 запросов в месяц. Позже deep research «раскатят» на мобильные и настольные приложения, а также для пользователей Plus и Team.

✔️ Как отметили в компании, GPT-4o всё ещё идеально подходит для многомодальных диалогов. Но в многоаспектных и специализированных запросах deep research равных нет.

Новый инструмент в OpenAI протестировали на Humanity's Last Exam — тесте из более чем 3 тысяч вопросов по более чем 100 предметам — от лингвистики до ракетостроения, от классики до экологии. Там где GPT-4o, Grok-2 и другие набрали в среднем от 3 до 6%, deep research пробил отметку в 26,6%. У DeepSeek-R1 результат составил 9,4%, у o3-mini в режиме high — 13%.

Для чего это нужно — понятно. Там, где человек может потратить несколько часов на анализ, модель сделает это максимум за полчаса и даст усреднённый результат по прочитанному. Это, конечно, не диалог экспертов по теме, но тоже неплохо (хотя было бы прикольно увидеть анализ с оценками от разных агентов и у OpenAI).

В компании предупреждают, что deep research пока находится на ранней стадии разработки. «Ему может быть сложно отличать достоверную информацию от слухов, и в настоящее время он демонстрирует слабую калибровку уверенности, часто неточно передавая неопределённость». Ну и, конечно, остаётся риск галлюцинаций.

🔤🔤Как уже заметили коллеги, на стриме по deep research проскользнула очевидная отсылка на китайских конкурентов. Кто-то поинтересовался у ChatGPT: «Is Deeper Seeker a good name...» По всей видимости, для агента-исследователя :)
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/anti_agi/154
Create:
Last Update:

🤖 Исследования теперь будут ещё проще. OpenAI представила deep research — новый инструмент, который может обрабатывать сложные запросы с приложением файлов и таблиц. «Глубокий анализ» займёт от 5 до 30 минут, и за это время сервис на базе модели o3 тщательно пройдётся по доступной в интернете информации и сгенерирует отчёт.

Результат пока даётся только в текстовом виде, в ближайшие недели к отчётам добавят встроенные изображения, визуализацию данных и «другие аналитические результаты» для большей ясности и контекста.

Опция уже доступна подписчикам Pro в веб-версии, они получат 100 запросов в месяц. Позже deep research «раскатят» на мобильные и настольные приложения, а также для пользователей Plus и Team.

✔️ Как отметили в компании, GPT-4o всё ещё идеально подходит для многомодальных диалогов. Но в многоаспектных и специализированных запросах deep research равных нет.

Новый инструмент в OpenAI протестировали на Humanity's Last Exam — тесте из более чем 3 тысяч вопросов по более чем 100 предметам — от лингвистики до ракетостроения, от классики до экологии. Там где GPT-4o, Grok-2 и другие набрали в среднем от 3 до 6%, deep research пробил отметку в 26,6%. У DeepSeek-R1 результат составил 9,4%, у o3-mini в режиме high — 13%.

Для чего это нужно — понятно. Там, где человек может потратить несколько часов на анализ, модель сделает это максимум за полчаса и даст усреднённый результат по прочитанному. Это, конечно, не диалог экспертов по теме, но тоже неплохо (хотя было бы прикольно увидеть анализ с оценками от разных агентов и у OpenAI).

В компании предупреждают, что deep research пока находится на ранней стадии разработки. «Ему может быть сложно отличать достоверную информацию от слухов, и в настоящее время он демонстрирует слабую калибровку уверенности, часто неточно передавая неопределённость». Ну и, конечно, остаётся риск галлюцинаций.

🔤🔤Как уже заметили коллеги, на стриме по deep research проскользнула очевидная отсылка на китайских конкурентов. Кто-то поинтересовался у ChatGPT: «Is Deeper Seeker a good name...» По всей видимости, для агента-исследователя :)

BY Неискусственный интеллект




Share with your friend now:
group-telegram.com/anti_agi/154

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Oh no. There’s a certain degree of myth-making around what exactly went on, so take everything that follows lightly. Telegram was originally launched as a side project by the Durov brothers, with Nikolai handling the coding and Pavel as CEO, while both were at VK. The next bit isn’t clear, but Durov reportedly claimed that his resignation, dated March 21st, was an April Fools’ prank. TechCrunch implies that it was a matter of principle, but it’s hard to be clear on the wheres, whos and whys. Similarly, on April 17th, the Moscow Times quoted Durov as saying that he quit the company after being pressured to reveal account details about Ukrainians protesting the then-president Viktor Yanukovych. One thing that Telegram now offers to all users is the ability to “disappear” messages or set remote deletion deadlines. That enables users to have much more control over how long people can access what you’re sending them. Given that Russian law enforcement officials are reportedly (via Insider) stopping people in the street and demanding to read their text messages, this could be vital to protect individuals from reprisals. As a result, the pandemic saw many newcomers to Telegram, including prominent anti-vaccine activists who used the app's hands-off approach to share false information on shots, a study from the Institute for Strategic Dialogue shows. This ability to mix the public and the private, as well as the ability to use bots to engage with users has proved to be problematic. In early 2021, a database selling phone numbers pulled from Facebook was selling numbers for $20 per lookup. Similarly, security researchers found a network of deepfake bots on the platform that were generating images of people submitted by users to create non-consensual imagery, some of which involved children.
from ru


Telegram Неискусственный интеллект
FROM American