group-telegram.com/khokhlovAR/914
Last Update:
Безусловно, наиболее громким событием января в области развития инструментов искусственного интеллекта (ИИ) стало появление китайской разработки DeepSeek (см. посты от 16 и 27 января), которая за несколько дней стала лидером на рынке ИИ-инструментов, основанных на больших языковых моделях, обогнав последнюю модель ChatGPT и вызвав потрясения на финансовых рынках.
На фоне политизированной болтовни, которую выдают по этому поводу многие мировые (да и российские) СМИ, а также истерических призывов что-нибудь запретить, выделяются голоса специалистов, понимающих причины такого неожиданного поворота событий. В частности, мне понравилась сегодняшняя заметка на портале ТАСС, которую опубликовал директор по ИИ и цифровым продуктам Билайна Константин Романов:
https://tass.ru/opinions/23021019
Он четко «разложил по полочкам» составляющие «рецепта успеха» DeepSeek, благодаря которым китайскому стартапу удалось создать на порядок более дешевый и требующий гораздо меньших вычислительных ресурсов ИИ-инструмент. К тому же, «код вместе с набором данных размещен в свободном доступе под полностью открытой лицензией с возможностью коммерческого использования. То есть любая компания может применять решение DeepSeek на своих мощностях.» И самый важный (по моему мнению) фрагмент:
«Также можно говорить о демократизации моделей. Наработки DeepSeek могут использоваться не только для улучшения существующих систем, но и для создания более легковесных. Это может стать толчком для появления новых игроков и моделей для решения узкоспециализированных задач в разных нишах. В том числе российские техлидеры также изучают возможность использования и адаптации технологии для своих решений, что в перспективе может помочь развитию и внедрению ИИ в РФ. Наши дата-сайентисты тестируют эту нейросеть вне основных проектов так же, как и другие модели, которые появляются на рынке. И пока мы не заметили существенных недостатков, кроме новизны нейросети, что априори препятствует ее скоропалительной интеграции в наши системы, следуя политике информационной безопасности компании.
Подведу итог. Если подход, разработанный DeepSeek, оправдает себя, начнется новая веха в разработке и внедрении моделей ИИ. Китайская компания дала толчок идее, что ИИ возможно создавать без огромных мощностей и вложений. Это может стать отправной точкой перестройки всей отрасли и сдвига в сторону оптимизации использования ресурсов, а не наращивания датасетов и инфраструктуры.»
Приведу также ссылку на вчерашнюю заметку в Nature, где новая китайская разработка также анализируется на уважительном серьезном уровне, свободном от перехлестов, не имеющих отношения к делу:
https://www.nature.com/articles/d41586-025-00229-6
Чтобы закончить этот серьезный пост на шутливой ноте, замечу, что ответы ChatGPT и DeepSeek различаются по стилю. ChatGPT выдает сухие тексты – «вот тебе ответ, и отстань от меня». А вот DeepSeek обязательно похвалит спрашивающего, скажет нечто типа «очень хороший вопрос, прямо в яблочко». И извиняется более «цветасто», когда его поймаешь на «галлюцинациях» (а они встречаются примерно так же часто, как в ChatGPT). Так что, воистину, «Восток – дело тонкое»; различные церемонии там играют более важную роль.
BY Алексей Хохлов
Share with your friend now:
group-telegram.com/khokhlovAR/914