Telegram Group Search
Forwarded from Адель и МЛь
Сэм Альтман рассказал о дальнейших планах OpenAI.

Планируют выпустить GPT-4.5 (подтвердили, что это Orion) в ближайшие недели — это будет последняя “нелинейно размышляющая” (non-chain-of-thought) модель.

Затем последует GPT-5, которая объединит модели o-series и GPT-series, станет универсальнее. Будет доступна как в приложении, так и через API.

GPT-5 заменит o3, а сама o3 не будет выпускаться отдельно. Бесплатные пользователи ChatGPT получат доступ к GPT-5 (на стандартном уровне интеллекта). Plus-подписчики получат улучшенную версию GPT-5. Pro-подписчики получат ещё более мощную версию, включающую голос, canvas, поиск, deep research и другие функции (какие?).

GPT-4.5 – через несколько недель!
GPT-5 – через несколько месяцев!
ChatGPT немного обновили:

- o1 и o3-mini теперь поддерживают картинки на входе и файлы

- o3-mini high теперь можно использовать 50 раз в день если у вас Plus подписка за 20$

- Deep research добавили во все аппы, готовят к релизу видимо
Сделал простой гайд какие модели когда использовать в ChatGPT:

GPT-4o mini – лучше не использовать, самая слабая и придумывает ответы; не способна следовать сложным инструкциям

GPT-4o – быстрая модель, для быстрых ответов не требующих проверки фактов, может их придумывать; перевожу ей картинки в текст если нужно быстро. Ее ответы нужно всегда факт-чекать. Зато эта модель имеет доступ к памяти (где все про вас), с ней можно общаться голосом, через нее можно вызывать генерацию картинок Dalle. Не рекомендую обрабатывать большие файлы с ней

GPT-4o with scheduled tasks (beta) – использую только для To Do: модель пишет мне каждое утро и спрашивает приоритеты, показывает текущий список задач и тп

o3-mini – хорошая модель для кодинга и жизни, хорошо ищет в интернете, неплохо следуют инструкциям и при этом очень быстрая; если вам некогда и нужен быстрый ответ, то берите ее. Для анализа картинок и файлов «быстро» хороший кандидат. Не имеет доступа к памяти. Реже ошибается в фактах, но ошибается. В Plus тире – 150 сообщений в день.

o3-mini-high – это просто версия o3-mini, которую просят думать подольше перед тем как дать ответ – работает она медленнее, но еще реже ошибается, и еще качественнее решает задачи. Великолепно следует инструкциям. Хорошо работает с файлами. Я бы советовал сначала тратить 50 запросов этой модели, и дальше переходить к o3-mini или o1.

o1 – модель генератор отчетов, эссе и рефератов. Медленная модель. Хорошо следует инструкциям, может ошибиться в фактах. Не может искать в интернете. Хорошо видит картинки и читает файлы, не теряя деталей. У вас всего 50 запросов в неделю. Требует промптинга с описанием отчета которого вы хотите получить.

o1 pro mode – лучшая модель на рынке: почти никогда не ошибается в фактах, решает самые сложные задачи кодинга, дольше всех думает, лучше всех понимает изображения, но не умеет искать в интернете и не умеет работать с файлами напрямую. С точки зрения фактов – модель всегда сама себя перепроверяет, за ~3 месяца использования я только один раз поймал ее на неточности. Требует детального промптинга с описанием отчета который вы хотите. Доступна только в Pro тире, лимитов нет.

Deep research – несмотря на то, что модель выведена в отдельную кнопку, это версия новой o3 для поиска в интернете, как ей лучше пользоваться я напишу отдельно когда дадут доступ всем. Модель ищет в интернете и сама пишет код (который вам не покажет) для анализа найденных данных, чтобы, например включить в отчет графики. Лучшее, что есть на рынке для поиска данных в интернете. Пока доступна только в Pro. Если активируете эту кнопку - выбор модели в выпадашке – игнорируется, UX который мы заслужили

Tldr:
Для повседневных задач ваш лучший выбор – o3-mini-high, потом o3-mini, когда у первой кончились лимиты
Как развлекаются мужчины:

UPD. Оказывается на канал нацелено миллион конкурентов за рекламный слот
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Люблю сложные алгоритмы

Автор
Please open Telegram to view this post
VIEW IN TELEGRAM
А я говорил - увлечение вайб-разработкой закончится разработкой, но уже не вайб 😘
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Neural Shit
Проблемы Prompt-программирования
Интересный вид атаки протестировали через опенсорс LLM-модели:

1. Берем любую опенсорс модель
2. Учим ее добавлять незаметно какие-то вещи в код (например, ссылки на вредоносные скрипты)
3. Загружаем обратно куда-то сохраняя имя оригинальной модели или просто делаем вид что это новая версия
4. Все, зараженную модель невозможно обнаружить, защиты тоже нету

Поэтому, всегда проверяйте кто поставщик модели и куда она загружена – у известных лаб как правило много прошлых публикаций моделей, рейтинги и тп

Tldr: всякие Deep.Seek.r1.2025.671b.BluRay.x264.AAC.gguf не качаем

На скриншоте пример взаимодействия с такой моделью и подключение вредоносного скрипта:
И менее приятные новости для психотерапевтов:

– Исследователи взяли 830 человек и просили отличить ответы ChatGPT от ответов 13 реальных психотерапевтов в области терапии пар (супружеские и тп). В итоге большинство участников не смогли распознать, где ответ АИ, а где – человеческий
¯\_(ツ)_/¯

– Более того, ответ ChatGPT получал более высокие оценки по ключевым принципам психотерапии: правда, возможно, людям просто лень печатать, так как у ChatGPT, как всегда, очень объемные ответы

– Авторы исследования призывают психотерапевтов расширять техническую грамотность (прям так и пишут). Еще добавляют, что интеграция АИ в сферу психического здоровья должна быть тщательно регулируема и проверяема

– Тестировали против людей GPT 4, то есть o3+ будет еще лучше в плане ответов

Источник:
https://journals.plos.org/mentalhealth/article?id=10.1371/journal.pmen.0000145
Forwarded from Адель и МЛь
This media is not supported in your browser
VIEW IN TELEGRAM
Art-выставка в Японии, где на вас пытается напасть робо-собака, прикованная цепью к стене. 🫠

Отсюда
POV человека который знает что хочет от жизни сегодня вечером:
Media is too big
VIEW IN TELEGRAM
Очень жду когда эта штука станет массово доступной и как в Sims 1, можно будет делегировать ей уборку дома ❤️

UPD: Доступен для покупки начиная с $16k, но как убирается пока не ясно

UPD 2: Стоит €25k в ЕС; в Амстердаме одна уборка стоит примерно ~100 евро, то есть эта штука окупиться за ~5 лет если делать по уборке в неделю… жду второю версию и беру

UPD 3: мне написал подписчик который с такими роботами работает, говорит – 80к стоит с нормальными руками, и чтобы убирать дом его придется учить буквально с нуля: показывать что такое пыль, как складывать рубашки, почему складывать кота плохо, и тп и тд, пока без роботов из Sims 1 🥲
Please open Telegram to view this post
VIEW IN TELEGRAM
ChatGPT 4o модель обновили, я на примерах собрал что нового ☕️

4o чуть-чуть разцензурили:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Ну и в целом модель стала почеловечнее в плане общения

Вы кстати хорошо выглядите сегодня, читатели 😂
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/02/16 06:28:53
Back to Top
HTML Embed Code: