ИИ для бизнеса / Михаил Ларькин

о3 почти такой же как и о1

Апдейт после дня тестов и анализа бенчмарков показал, что новая модель не сильно умнее чем о1, а иногда даже хуже. На первый взгляд выглядит как разочарование и просто PR от OpenAI, чтобы заполнить инфопространство, которое заполнил DeepSeek.

Давайте разбираться:
В официальных сравнениях от OpenAI видно, что новая модель немного лучше, чем старая - самая умная, а по реальным тестам за последний день видно, что она даже немного хуже.

Тогда вопрос - зачем выпускать модель качества ниже.

о1 была Овер умной и такой же Овер долгой и дорогой, она могла думать минутами, а здесь мы получаем модель, которая отвечает в несколько раз быстрее, как обычный 4о, и при этом стоимость по API в 10 раз меньше, что делает эту модель более пригодной для коммерчески интересных и эффективных проектов.

Если о1 нельзя было использовать для ведения диалогов из-за долгих ответов, нельзя было использовать на частых задачах и массовом пользователем, так как практически любая задача человеком выполнялась дешевле за 1 выполнение, а ждать 1-2 минуты пользователи современных приложений не всегда готовы, поэтому ее использовали в основном для б2б продуктов или построения отчетов и чего-то такого.

Теперь мы получаем модель, которую можно запускать на массовый рынок с быстрым ответом и стоимостью выполнения 1й задачи на круг дешевле чем привлечение человека на нее же.

Вижу в соц сетях комменты, что пользователи не увидели прироста качества ответа.

А его и не должно быть, не на этом OpenAI сделали акцент, акцент на стоимости(API) и скорости ответа (интерфейс), тут сравнивать нужно о1 и о3.

Короче, мы получили коммерчески эффективную модель.

www.group-telegram.com/us/larkinmd07.com/792

509 viewsFeb 1 at 11:50

group-telegram.com/larkinmd07/792

Create: 2025-02-01
Last Update: 2025-02-04 18:43:09

BY ИИ для бизнеса / Михаил Ларькин

Share with your friend now:
group-telegram.com/larkinmd07/792

Telegram | DID YOU KNOW?

о3 почти такой же как и о1