Forwarded from Адель и МЛь
Сэм Альтман рассказал о дальнейших планах OpenAI.
Планируют выпустить GPT-4.5 (подтвердили, что это Orion) в ближайшие недели — это будет последняя “нелинейно размышляющая” (non-chain-of-thought) модель.
Затем последует GPT-5, которая объединит модели o-series и GPT-series, станет универсальнее. Будет доступна как в приложении, так и через API.
GPT-5 заменит o3, а сама o3 не будет выпускаться отдельно. Бесплатные пользователи ChatGPT получат доступ к GPT-5 (на стандартном уровне интеллекта). Plus-подписчики получат улучшенную версию GPT-5. Pro-подписчики получат ещё более мощную версию, включающую голос, canvas, поиск, deep research и другие функции (какие?).
GPT-4.5 – через несколько недель!
GPT-5 – через несколько месяцев!
Планируют выпустить GPT-4.5 (подтвердили, что это Orion) в ближайшие недели — это будет последняя “нелинейно размышляющая” (non-chain-of-thought) модель.
Затем последует GPT-5, которая объединит модели o-series и GPT-series, станет универсальнее. Будет доступна как в приложении, так и через API.
GPT-5 заменит o3, а сама o3 не будет выпускаться отдельно. Бесплатные пользователи ChatGPT получат доступ к GPT-5 (на стандартном уровне интеллекта). Plus-подписчики получат улучшенную версию GPT-5. Pro-подписчики получат ещё более мощную версию, включающую голос, canvas, поиск, deep research и другие функции (какие?).
GPT-4.5 – через несколько недель!
GPT-5 – через несколько месяцев!
X (formerly Twitter)
Sam Altman (@sama) on X
OPENAI ROADMAP UPDATE FOR GPT-4.5 and GPT-5:
We want to do a better job of sharing our intended roadmap, and a much better job simplifying our product offerings.
We want AI to “just work” for you; we realize how complicated our model and product offerings…
We want to do a better job of sharing our intended roadmap, and a much better job simplifying our product offerings.
We want AI to “just work” for you; we realize how complicated our model and product offerings…
ChatGPT немного обновили:
- o1 и o3-mini теперь поддерживают картинки на входе и файлы
- o3-mini high теперь можно использовать 50 раз в день если у вас Plus подписка за 20$
- Deep research добавили во все аппы, готовят к релизу видимо
- o1 и o3-mini теперь поддерживают картинки на входе и файлы
- o3-mini high теперь можно использовать 50 раз в день если у вас Plus подписка за 20$
- Deep research добавили во все аппы, готовят к релизу видимо
Сделал простой гайд какие модели когда использовать в ChatGPT:
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней
GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп
o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.
✨o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.
o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.
o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.
Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили
Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям
GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней
GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп
o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.
✨o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.
o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.
o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.
Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили
Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
Please open Telegram to view this post
VIEW IN TELEGRAM
А я говорил - увлечение вайб-разработкой закончится разработкой, но уже не вайб 😘
Please open Telegram to view this post
VIEW IN TELEGRAM
Интересный вид атаки протестировали через опенсорс LLM-модели:
1. Берем любую опенсорс модель
2. Учим ее добавлять незаметно какие-то вещи в код (например, ссылки на вредоносные скрипты)
3. Загружаем обратно куда-то сохраняя имя оригинальной модели или просто делаем вид что это новая версия
4. Все, зараженную модель невозможно обнаружить, защиты тоже нету
Поэтому, всегда проверяйте кто поставщик модели и куда она загружена – у известных лаб как правило много прошлых публикаций моделей, рейтинги и тп
Tldr: всякие
На скриншоте пример взаимодействия с такой моделью и подключение вредоносного скрипта:
1. Берем любую опенсорс модель
2. Учим ее добавлять незаметно какие-то вещи в код (например, ссылки на вредоносные скрипты)
3. Загружаем обратно куда-то сохраняя имя оригинальной модели или просто делаем вид что это новая версия
4. Все, зараженную модель невозможно обнаружить, защиты тоже нету
Поэтому, всегда проверяйте кто поставщик модели и куда она загружена – у известных лаб как правило много прошлых публикаций моделей, рейтинги и тп
Tldr: всякие
Deep.Seek.r1.2025.671b.BluRay.x264.AAC.gguf
не качаемНа скриншоте пример взаимодействия с такой моделью и подключение вредоносного скрипта:
И менее приятные новости для психотерапевтов:
– Исследователи взяли 830 человек и просили отличить ответы ChatGPT от ответов 13 реальных психотерапевтов в области терапии пар (супружеские и тп). В итоге большинство участников не смогли распознать, где ответ АИ, а где – человеческий
¯\_(ツ)_/¯
– Более того, ответ ChatGPT получал более высокие оценки по ключевым принципам психотерапии: правда, возможно, людям просто лень печатать, так как у ChatGPT, как всегда, очень объемные ответы
– Авторы исследования призывают психотерапевтов расширять техническую грамотность (прям так и пишут). Еще добавляют, что интеграция АИ в сферу психического здоровья должна быть тщательно регулируема и проверяема
– Тестировали против людей GPT 4, то есть o3+ будет еще лучше в плане ответов
Источник:
https://journals.plos.org/mentalhealth/article?id=10.1371/journal.pmen.0000145
– Исследователи взяли 830 человек и просили отличить ответы ChatGPT от ответов 13 реальных психотерапевтов в области терапии пар (супружеские и тп). В итоге большинство участников не смогли распознать, где ответ АИ, а где – человеческий
¯\_(ツ)_/¯
– Более того, ответ ChatGPT получал более высокие оценки по ключевым принципам психотерапии: правда, возможно, людям просто лень печатать, так как у ChatGPT, как всегда, очень объемные ответы
– Авторы исследования призывают психотерапевтов расширять техническую грамотность (прям так и пишут). Еще добавляют, что интеграция АИ в сферу психического здоровья должна быть тщательно регулируема и проверяема
– Тестировали против людей GPT 4, то есть o3+ будет еще лучше в плане ответов
Источник:
https://journals.plos.org/mentalhealth/article?id=10.1371/journal.pmen.0000145
journals.plos.org
When ELIZA meets therapists: A Turing test for the heart and mind
“Can machines be therapists?” is a question receiving increased attention given the relative ease of working with generative artificial intelligence. Although recent (and decades-old) research has found that humans struggle to tell the difference between…
Media is too big
VIEW IN TELEGRAM
Очень жду когда эта штука станет массово доступной и как в Sims 1, можно будет делегировать ей уборку дома ❤️
UPD: Доступен для покупки начиная с $16k, но как убирается пока не ясно
UPD 2: Стоит €25k в ЕС; в Амстердаме одна уборка стоит примерно ~100 евро, то есть эта штука окупиться за ~5 лет если делать по уборке в неделю… жду второю версию и беру
UPD 3: мне написал подписчик который с такими роботами работает, говорит – 80к стоит с нормальными руками, и чтобы убирать дом его придется учить буквально с нуля: показывать что такое пыль, как складывать рубашки, почему складывать кота плохо, и тп и тд, пока без роботов из Sims 1 🥲
UPD: Доступен для покупки начиная с $16k, но как убирается пока не ясно
UPD 2: Стоит €25k в ЕС; в Амстердаме одна уборка стоит примерно ~100 евро, то есть эта штука окупиться за ~5 лет если делать по уборке в неделю… жду второю версию и беру
UPD 3: мне написал подписчик который с такими роботами работает, говорит – 80к стоит с нормальными руками, и чтобы убирать дом его придется учить буквально с нуля: показывать что такое пыль, как складывать рубашки, почему складывать кота плохо, и тп и тд, пока без роботов из Sims 1 🥲
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Ну и в целом модель стала почеловечнее в плане общения
Вы кстати хорошо выглядите сегодня, читатели😂
Вы кстати хорошо выглядите сегодня, читатели
Please open Telegram to view this post
VIEW IN TELEGRAM