Telegram Group & Telegram Channel
В чем особенность DeepSeek и почему он «взорвал» информационное пространство

Китай запускает еще одну нейросеть. В среду Alibaba представила свою языковую модель Qwen2.5-Max. Заявлено, что она превосходит и ChatGPT, и взорвавший информационное пространство DeepSeek. ЦСП «Платформа» попросила прокомментировать ситуацию одного из признанных российских экспертов по ИИ, руководителя направления ИИ «Сберуниверситет» Андрея Комиссарова. Ниже - в чем именно заключается прорыв DeepSeek, а в следующих постах расскажем о ситуации с языковыми моделями в России.

Вопрос с DeepSeek не в том, что они сделали какой-то особо производительный продукт. Нейросетей, сопоставимых по показателям с OpenAI или в чем-то их превосходящих, много. DeepSeek просто хакнули подход к рынку. Это можно назвать демпингом.

Принципиальный момент в DeepSeek – это миллионное контекстное окно, которое по стоимости в три раза ниже, чем 64-тысячное контекстное окно GPT. Контекстное окно – это то, сколько символов вы можете «загнать» в модель, чтобы попросить ее что-то сделать.

Второй момент: GPT очень кичится совей моделью ризонинга (способность моделей делать выводы и принимать решения на основе имеющихся данных). А DeepSeek этот подход дает уже в основе, даже в бесплатной версии.

Третий момент: аналог perplexity (возможность сверять информацию с уже имеющимися данными) тоже идет уже в базе, бесплатный.

В общем, DeepSeek – неплохая нейросеть, в некоторых позициях она лучше GPT, в некоторых такая же. Но главное – не некий технический прорыв, а стоимость продукта.

Что касается open-source (открытого исходного кода DeepSeek). Это нормальный рыночный ход. Если вы открываете исходный код, вы, во-первых, получаете гораздо больше разработчиков, которые могут что-то новое привнести в ваш основной продукт.

А, во-вторых – вы получаете лояльность к бренду. Стартаперы на поле ИИ отличаются двумя особенностями: первое – очень высокая волатильность персонала. И когда разработчики прыгают из компании в компанию, они за счет лояльности к бренду осеменяют вашим кодом другую компанию.

А второй момент – практически все стартаперы в области ИИ – серийные стартаперы. То есть они, как правило, делают не один стартап, а много: один – любимый, второй – экспериментальный, в третьем просто дурака валяют, четвертый – продуктовый. И это все взаимосвязано. Чем больше бизнесменов и разработчиков лояльны твоему продукту, тем больше твой продукт распространяется по рынку.

Если не идти в open-source, лояльность к продукту будет только у «ждунов». «Ждуны», например, это те, кто говорит: смотрите, OpenAI – гиганты, они все сделали, они представили продукт. Мы сейчас посидим, подождем, а они сами избавятся от всех глюков. А у нас уже вся инфраструктура на них завязана. Чем больше будет open-source, тем меньше на рынке останется «ждунов», и тем меньше людей будут платить тому же OpenAI. А OpenAI надо возвращать кредиты, и нужны финансовые вливания.

Отсюда волнение на рынке, которое описали в СМИ.

#ИИ
🔹 ЦСП «Платформа»
Please open Telegram to view this post
VIEW IN TELEGRAM



group-telegram.com/sociocrisis/776
Create:
Last Update:

В чем особенность DeepSeek и почему он «взорвал» информационное пространство

Китай запускает еще одну нейросеть. В среду Alibaba представила свою языковую модель Qwen2.5-Max. Заявлено, что она превосходит и ChatGPT, и взорвавший информационное пространство DeepSeek. ЦСП «Платформа» попросила прокомментировать ситуацию одного из признанных российских экспертов по ИИ, руководителя направления ИИ «Сберуниверситет» Андрея Комиссарова. Ниже - в чем именно заключается прорыв DeepSeek, а в следующих постах расскажем о ситуации с языковыми моделями в России.

Вопрос с DeepSeek не в том, что они сделали какой-то особо производительный продукт. Нейросетей, сопоставимых по показателям с OpenAI или в чем-то их превосходящих, много. DeepSeek просто хакнули подход к рынку. Это можно назвать демпингом.

Принципиальный момент в DeepSeek – это миллионное контекстное окно, которое по стоимости в три раза ниже, чем 64-тысячное контекстное окно GPT. Контекстное окно – это то, сколько символов вы можете «загнать» в модель, чтобы попросить ее что-то сделать.

Второй момент: GPT очень кичится совей моделью ризонинга (способность моделей делать выводы и принимать решения на основе имеющихся данных). А DeepSeek этот подход дает уже в основе, даже в бесплатной версии.

Третий момент: аналог perplexity (возможность сверять информацию с уже имеющимися данными) тоже идет уже в базе, бесплатный.

В общем, DeepSeek – неплохая нейросеть, в некоторых позициях она лучше GPT, в некоторых такая же. Но главное – не некий технический прорыв, а стоимость продукта.

Что касается open-source (открытого исходного кода DeepSeek). Это нормальный рыночный ход. Если вы открываете исходный код, вы, во-первых, получаете гораздо больше разработчиков, которые могут что-то новое привнести в ваш основной продукт.

А, во-вторых – вы получаете лояльность к бренду. Стартаперы на поле ИИ отличаются двумя особенностями: первое – очень высокая волатильность персонала. И когда разработчики прыгают из компании в компанию, они за счет лояльности к бренду осеменяют вашим кодом другую компанию.

А второй момент – практически все стартаперы в области ИИ – серийные стартаперы. То есть они, как правило, делают не один стартап, а много: один – любимый, второй – экспериментальный, в третьем просто дурака валяют, четвертый – продуктовый. И это все взаимосвязано. Чем больше бизнесменов и разработчиков лояльны твоему продукту, тем больше твой продукт распространяется по рынку.

Если не идти в open-source, лояльность к продукту будет только у «ждунов». «Ждуны», например, это те, кто говорит: смотрите, OpenAI – гиганты, они все сделали, они представили продукт. Мы сейчас посидим, подождем, а они сами избавятся от всех глюков. А у нас уже вся инфраструктура на них завязана. Чем больше будет open-source, тем меньше на рынке останется «ждунов», и тем меньше людей будут платить тому же OpenAI. А OpenAI надо возвращать кредиты, и нужны финансовые вливания.

Отсюда волнение на рынке, которое описали в СМИ.

#ИИ
🔹 ЦСП «Платформа»

BY Платформа | Социальное проектирование




Share with your friend now:
group-telegram.com/sociocrisis/776

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In 2018, Russia banned Telegram although it reversed the prohibition two years later. At this point, however, Durov had already been working on Telegram with his brother, and further planned a mobile-first social network with an explicit focus on anti-censorship. Later in April, he told TechCrunch that he had left Russia and had “no plans to go back,” saying that the nation was currently “incompatible with internet business at the moment.” He added later that he was looking for a country that matched his libertarian ideals to base his next startup. Crude oil prices edged higher after tumbling on Thursday, when U.S. West Texas intermediate slid back below $110 per barrel after topping as much as $130 a barrel in recent sessions. Still, gas prices at the pump rose to fresh highs. Just days after Russia invaded Ukraine, Durov wrote that Telegram was "increasingly becoming a source of unverified information," and he worried about the app being used to "incite ethnic hatred." Since its launch in 2013, Telegram has grown from a simple messaging app to a broadcast network. Its user base isn’t as vast as WhatsApp’s, and its broadcast platform is a fraction the size of Twitter, but it’s nonetheless showing its use. While Telegram has been embroiled in controversy for much of its life, it has become a vital source of communication during the invasion of Ukraine. But, if all of this is new to you, let us explain, dear friends, what on Earth a Telegram is meant to be, and why you should, or should not, need to care.
from nl


Telegram Платформа | Социальное проектирование
FROM American