В последние дни я много слышал о китайском чудо-инструменте искусственного интеллекта DeepSeek

Алексей Хохлов

В последние дни я много слышал о китайском чудо-инструменте искусственного интеллекта DeepSeek, который не только работает лучше многих имеющихся инструментов, основанных на больших языковых моделях (в том числе, лучше ChatGPT, даже в последней версии), но и относится к категории Open Source, кроме того он бесплатно-свободно и без всяких ухищрений доступен российским пользователям. А вчера вышла хвалебная статья в Science об этом инструменте:

https://www.science.org/content/article/chinese-firm-s-faster-cheaper-ai-language-model-makes-splash

В частности, в ней утверждается, что подход DeepSeek «включает улучшение так называемой архитектуры Mixture of Experts. Она снижает вычислительную мощность, необходимую для обучения модели, и выдает более эффективные ответы на запросы. Только подмножество экспертных сетей в модели обучается для выполнения задачи. Затем сеть отправляет адресные запросы только тем экспертным сетям, которые наиболее подходят для ответа.»

В результате на обучение DeepSeek было потрачено всего $5.6 млн., тогда как обучение ChatGPT-4o стоило $78 млн. Операционные затраты при работе DeepSeek также намного меньше, чем для других моделей. Стоит также обратить внимание на слова генерального директора DeepSeek Лян Вэньфэна о том, что «исследования и технологические инновации, а не бизнес-возможности, являются приоритетом компании. Ее конечная цель — достичь такого уровня искусственного интеллекта, который бы соответствовал когнитивным способностям человека. Эта высокая цель помогла фирме привлечь амбициозных исследователей.»

После таких рекомендаций от Science я решил проверить, как все это работает. Зашел на

https://www.deepseek.com/

непосредственно через google-account и приступил к общению в чате на тему предыдущего поста (опубликованного сегодня утром) о глобальном потеплении. Результат можно посмотреть здесь:

https://disk.yandex.ru/i/-7IxJEx0SsmpKw

Видно, что ответы на мои короткие вопросы полные и исчерпывающие, хотя они не выходят за рамки mainstream reasoning (но странно было бы ожидать оригинальности от большой языковой модели). Потом я начал использовать поисковую функцию «Search», просил дать ссылки на обзорные статьи по тому или иному научному вопросу – все работает, причем ответ выдается не в виде совокупности ссылок, а в виде связного текста, куда ссылки вкраплены, как во введении к реальной научной статье. Причем все ссылки реальные, не вымышленные, как часто бывает в текстах, написанных ChatGPT.

Потом я перешел на общение на русском языке – все точно так же отлично работает, включая не только научные вопросы, но и, например, написание стихов на какую-нибудь тему в стиле того или иного поэта прошлого (опять-таки, если обращать внимание на стиль, а не оригинальность мысли). В общем, советовал бы попробовать этот инструмент, к которому у российских пользователей есть безбарьерный и бесплатный доступ (кстати, его можно установить и на мобильных устройствах, скачав соответствующее приложение из AppStore или GooglePlay).

Science

Chinese firm’s faster, cheaper AI language model makes a splash

DeepSeek’s open-source answer to ChatGPT is “a highly impressive display of research,” expert says

www.group-telegram.com/pl/khokhlovAR.com/901

17.9K viewsJan 16 at 14:22

group-telegram.com/khokhlovAR/901

Create: 2025-01-16
Last Update: 2025-01-17 16:24:34

BY Алексей Хохлов

Share with your friend now:
group-telegram.com/khokhlovAR/901

Telegram | DID YOU KNOW?

В последние дни я много слышал о китайском чудо-инструменте искусственного интеллекта DeepSeek