о3 почти такой же как и о1
Апдейт после дня тестов и анализа бенчмарков показал, что новая модель не сильно умнее чем о1, а иногда даже хуже. На первый взгляд выглядит как разочарование и просто PR от OpenAI, чтобы заполнить инфопространство, которое заполнил DeepSeek.
Давайте разбираться:
В официальных сравнениях от OpenAI видно, что новая модель немного лучше, чем старая - самая умная, а по реальным тестам за последний день видно, что она даже немного хуже.
Тогда вопрос - зачем выпускать модель качества ниже.
о1 была Овер умной и такой же Овер долгой и дорогой, она могла думать минутами, а здесь мы получаем модель, которая отвечает в несколько раз быстрее, как обычный 4о, и при этом стоимость по API в 10 раз меньше, что делает эту модель более пригодной для коммерчески интересных и эффективных проектов.
Если о1 нельзя было использовать для ведения диалогов из-за долгих ответов, нельзя было использовать на частых задачах и массовом пользователем, так как практически любая задача человеком выполнялась дешевле за 1 выполнение, а ждать 1-2 минуты пользователи современных приложений не всегда готовы, поэтому ее использовали в основном для б2б продуктов или построения отчетов и чего-то такого.
Теперь мы получаем модель, которую можно запускать на массовый рынок с быстрым ответом и стоимостью выполнения 1й задачи на круг дешевле чем привлечение человека на нее же.
Вижу в соц сетях комменты, что пользователи не увидели прироста качества ответа.
А его и не должно быть, не на этом OpenAI сделали акцент, акцент на стоимости(API) и скорости ответа (интерфейс), тут сравнивать нужно о1 и о3.
Короче, мы получили коммерчески эффективную модель.
Апдейт после дня тестов и анализа бенчмарков показал, что новая модель не сильно умнее чем о1, а иногда даже хуже. На первый взгляд выглядит как разочарование и просто PR от OpenAI, чтобы заполнить инфопространство, которое заполнил DeepSeek.
Давайте разбираться:
В официальных сравнениях от OpenAI видно, что новая модель немного лучше, чем старая - самая умная, а по реальным тестам за последний день видно, что она даже немного хуже.
Тогда вопрос - зачем выпускать модель качества ниже.
о1 была Овер умной и такой же Овер долгой и дорогой, она могла думать минутами, а здесь мы получаем модель, которая отвечает в несколько раз быстрее, как обычный 4о, и при этом стоимость по API в 10 раз меньше, что делает эту модель более пригодной для коммерчески интересных и эффективных проектов.
Если о1 нельзя было использовать для ведения диалогов из-за долгих ответов, нельзя было использовать на частых задачах и массовом пользователем, так как практически любая задача человеком выполнялась дешевле за 1 выполнение, а ждать 1-2 минуты пользователи современных приложений не всегда готовы, поэтому ее использовали в основном для б2б продуктов или построения отчетов и чего-то такого.
Теперь мы получаем модель, которую можно запускать на массовый рынок с быстрым ответом и стоимостью выполнения 1й задачи на круг дешевле чем привлечение человека на нее же.
Вижу в соц сетях комменты, что пользователи не увидели прироста качества ответа.
А его и не должно быть, не на этом OpenAI сделали акцент, акцент на стоимости(API) и скорости ответа (интерфейс), тут сравнивать нужно о1 и о3.
Короче, мы получили коммерчески эффективную модель.
group-telegram.com/larkinmd07/792
Create:
Last Update:
Last Update:
о3 почти такой же как и о1
Апдейт после дня тестов и анализа бенчмарков показал, что новая модель не сильно умнее чем о1, а иногда даже хуже. На первый взгляд выглядит как разочарование и просто PR от OpenAI, чтобы заполнить инфопространство, которое заполнил DeepSeek.
Давайте разбираться:
В официальных сравнениях от OpenAI видно, что новая модель немного лучше, чем старая - самая умная, а по реальным тестам за последний день видно, что она даже немного хуже.
Тогда вопрос - зачем выпускать модель качества ниже.
о1 была Овер умной и такой же Овер долгой и дорогой, она могла думать минутами, а здесь мы получаем модель, которая отвечает в несколько раз быстрее, как обычный 4о, и при этом стоимость по API в 10 раз меньше, что делает эту модель более пригодной для коммерчески интересных и эффективных проектов.
Если о1 нельзя было использовать для ведения диалогов из-за долгих ответов, нельзя было использовать на частых задачах и массовом пользователем, так как практически любая задача человеком выполнялась дешевле за 1 выполнение, а ждать 1-2 минуты пользователи современных приложений не всегда готовы, поэтому ее использовали в основном для б2б продуктов или построения отчетов и чего-то такого.
Теперь мы получаем модель, которую можно запускать на массовый рынок с быстрым ответом и стоимостью выполнения 1й задачи на круг дешевле чем привлечение человека на нее же.
Вижу в соц сетях комменты, что пользователи не увидели прироста качества ответа.
А его и не должно быть, не на этом OpenAI сделали акцент, акцент на стоимости(API) и скорости ответа (интерфейс), тут сравнивать нужно о1 и о3.
Короче, мы получили коммерчески эффективную модель.
Апдейт после дня тестов и анализа бенчмарков показал, что новая модель не сильно умнее чем о1, а иногда даже хуже. На первый взгляд выглядит как разочарование и просто PR от OpenAI, чтобы заполнить инфопространство, которое заполнил DeepSeek.
Давайте разбираться:
В официальных сравнениях от OpenAI видно, что новая модель немного лучше, чем старая - самая умная, а по реальным тестам за последний день видно, что она даже немного хуже.
Тогда вопрос - зачем выпускать модель качества ниже.
о1 была Овер умной и такой же Овер долгой и дорогой, она могла думать минутами, а здесь мы получаем модель, которая отвечает в несколько раз быстрее, как обычный 4о, и при этом стоимость по API в 10 раз меньше, что делает эту модель более пригодной для коммерчески интересных и эффективных проектов.
Если о1 нельзя было использовать для ведения диалогов из-за долгих ответов, нельзя было использовать на частых задачах и массовом пользователем, так как практически любая задача человеком выполнялась дешевле за 1 выполнение, а ждать 1-2 минуты пользователи современных приложений не всегда готовы, поэтому ее использовали в основном для б2б продуктов или построения отчетов и чего-то такого.
Теперь мы получаем модель, которую можно запускать на массовый рынок с быстрым ответом и стоимостью выполнения 1й задачи на круг дешевле чем привлечение человека на нее же.
Вижу в соц сетях комменты, что пользователи не увидели прироста качества ответа.
А его и не должно быть, не на этом OpenAI сделали акцент, акцент на стоимости(API) и скорости ответа (интерфейс), тут сравнивать нужно о1 и о3.
Короче, мы получили коммерчески эффективную модель.
BY ИИ для бизнеса / Михаил Ларькин
Share with your friend now:
group-telegram.com/larkinmd07/792