🤖 Побудем в роли догоняющих, но всё же. Вчера Perplexity
представила свою версию Deep Research, и что самое главное — сделала её бесплатной для всех. В день можно отправить до 5 запросов, подписчики Pro могут генерировать дл 500 отчётов в день.
Утверждается, что в Humanity's Last Exam сервис набрал 21,1%
против 26,6% у версии OpenAI. Казалось бы, вот она, революция! Одними экспериментами Hugging Face дело больше
не ограничивается. Но на практике всё оказалось куда скучнее.
❓ По ощущениям, модель работает как ленивый первокурсник на стажировке. На обработку наших запросов Deep Research тратил не более нескольких минут и с явной неохотой брал в расчёт более 20 источников. Выдаваемый результат — хорошо структурирован и крайне стерилен, но почти бесполезен.
Прошёлся по Perplexity с вопросами из сферы исторических исследований и рыночного анализа. Несмотря на все уточнения, получил максимально поверхностные ответы, в основном собранные из онлайн-энциклопедий и первых результатов выдачи в поиске.
🔤🔤С учётом того, что всё это нужно ещё и проверять на предмет галлюцинаций, в итоге оказалось проще погуглить самому. Отчётами я бы это не назвал даже близко: моим фаворитом в этом направлении до сих пор
остаётся STORM от Стэнфордского университета с его полифонией экспертных голосов.
В общем, не верим бенчмаркам и хайпожорам-убийцам OpenAI, смотрим на фактическую производительность :)
@anti_agi