group-telegram.com/nejdanov/383
Last Update:
ИИ-комьюнити взахлеб обсуждает новинку от OpenAI — языковую модель GPT-4o. Энтузиасты не жалеют характеристик вроде “сумасшествие” или “безумие”, говоря о новинке, и считают что это очередная ИИ-революция. “Мы уже почти в фильме Her”, говорят они.
Скептики и конкуренты компании отмечают что это скорее фейл, чем победа. Все с замиранием сердца ждали на вчерашней презентации GPT-5 — чего-то принципиально нового, следующего шага на пути к сильному ИИ, который подтвердил бы лидерский статус компании Альтмана. Вместо этого получили 4o — слегка улучшенную версию 4 Turbo, которая была улучшенной версией модели 4. За 14 месяцев работы над GPT-5 компании все еще нечего предьявить, из-за чего многие опять заговорят о заморозке ИИ-прогресса и про утрату OpenAI лидерской позиции.
Главная новация модели GPT-4o — улучшенная способность нейросети воспринимать любую комбинацию звука, текста и изображения и выдавать ответы в форме звука, текста и изображений. Если упростить — нейросеть стала лучше разговаривать и понимать, что она видит, если вы разрешаете ей смотреть на мир через камеры ваших девайсов.
Например, вы можете навести камеру смартфона на птичек в озере и нейросеть расскажет вам, что это за птички, что они делают и посоветует чем их кормить. Такая функция очевидно круто будет смотреться в очках дополненной реальности, чтобы вы просто спрашивали “что я вижу?” и она отвечала, спрашивали “что мне делать с этим?” и она инструктировала. Пока у OpenAI, в отличие от Meta, нет своих очков — и, возможно, о создании какого-то такого девайса Альтман и договаривается с Джони Айвом, отвечавшим за дизайн айфона в Apple. Кстати он и с Apple договаривается, чтобы интегрировать ChatGPT в iOS 18 для айфонов.
Вообще, от OpenAI все сильнее веет вайбом Apple, в худшем смысле: попытка создавать хайп и фетишизировать бренд, не создавая ничего нового и переупаковывая свою былую славу. Яблочная компания, блиставшая при Стиве Джобсе, сегодня стоит почти 3 триллиона долларов, но не может даже рекламу нормальную снять: для рекламы типа нового IPad копирует рекламу смартфона LG за 2008 год.
Я думаю, что выход GPT-4o (кстати, “о” в названии — от слова “omni”, латинского префикса означающего “все”) все же можно считать очередной победой Альтмана. Хайп вокруг релиза доказывает культовый статус OpenAI, а суть релиза – акцент на голосовом общении с LLM – последовательно реализует видение Альтмана, который считает, что главная задача ИИ в ближайшем будущем — стать нашими всевидящими и всезнающими помощниками, которые всегда рядом. Меня конечно беспокоит потенциальная кошмарность такого его видения, особенно во всяких там тоталитарных режимах, но об этом поговорим как нибудь в другой раз.
(На фото Мира Мурати, CTO OpenAI. Из презентации GPT-4o мне больше всего понравилось как нейросеть переводит ее итальянский на английский и обратно)
BY Чорт ногу сломит
Share with your friend now:
group-telegram.com/nejdanov/383