Telegram Group & Telegram Channel
Какие большие языковые модели сейчас лучшие на рынке?

Сжатая квинтэссенция двух лет работы с LLM и попытки их адаптировать в рабочие процессы.

Так все быстро меняется, что текущий срез окажется неактуальным практически сразу после выхода.

Я пока опущу аудио, фото и видео генерацию, т.к. не являюсь художником, монтажером, режиссером, дизайнером или музыкантом, чтобы делать профессиональный и компетентные выводы.

При этом я разрабатываю и внедряю передовые аналитические и информационные решения и в этом контексте есть, что сказать.

С точки зрения внедрения LLM непосредственно в собственные рабочие проекты – прогресса нет никакого за два года, весьма специфические и сложные задачи (здесь требуется серия отдельных материалов, чтобы обосновать все проблемы и ограничения внедрения LLM в бизнес и/или научные проекты).

Сейчас очень краткий разбор того, какие наиболее сильные LLM присутствуют на рынке, т.к. я их пробовал все. Полноценный обзор потребует серии статьей на 5-7 материалов, но пока нет времени на это.

▪️Главные разочарования 2024 года: Perplexity и … Claude!

● Perplexity был очень крут в 2023, представив революционный на тот момент инструмент умного поиска, но они застыли на уровне 2023, не представив ничего существенного за год при сильном прогрессе конкурентов. Perplexity потерял гибкость в глубокой настройке выходного результата и плохо следует инструкциям в разделе «Spaces». Сейчас Perplexity выдает посредственные результаты в сравнении с возможностями конкурентов, не оправдывая стоимость подписки.

● Claude хорош во всем, за исключением того, что нет выхода в сеть. LLM без актуальной инфы – это архаика в 2025. Claude по сути теряет смысл в платной подписке при всех своих преимуществах, не позволяя актуализировать и верифицировать выходную генерацию токенов.

▪️Главные открытия или успех в 2024 году: феерический взлет DeepSeek, прогресс Google и инновации OpenAI.

DeepSeek – феноменален, это за гранью понимания того, как можно было сделать в ограниченном бюджете и ресурсе настолько волшебную LLM. DeepSeek вне всяких сомнений вызывает восторг и удивление. Прорыв китайцев, который не просто сократил отставание от ведущих американских LLM, но вполне конкурирует и даже опережает их. DeepSeek R1 однозначно намного сильнее, быстрее и лучше, чем последние разработки Anthropic, Google или даже OpenAI, за исключением o1 и o1 pro.

Китайцы в декабре 2024 вызвали настоящую панику среди технологического сегмента США, никто не понимал, как им удалось сделать такой эффективный проект. Ожидаю новых чудес от китайцев.

Google – это история о том, как очень мощное инженерное подразделение оказалось в тени безумных маркетологов и подразделения, ответственного за публичное внедрение и адаптацию LLM. Суть в том, что основа LLM от Google очень хороша (прогресс за год сильный), но в публичной версии так много ограничений и цензуры, что просто неприемлема для работы.

Я использую исключительно среду для разработчиков Google AI Studio и бета версии непубличных моделей типа Gemini 2.0 Flash Experimental и Gemini 2.0 Flash Thinking. Сильное преимущество Google над всеми остальными – очень четкое следование инструкциям. Если в начале 2024 эффективность LLM от Google была не выше 1% (1 из 100 вопросов был на уровне или выше конкурентов), сейчас ближе к 25%, что уже приемлемо для работы.

OpenAI – все еще остается неоспоримым лидером по совокупности факторов. Да, ChatGPT 4o безнадежно устарел и архаичен сейчас, но в конце 2024 они выпустили мощные модели o1 и o1 pro, которые снова вырвались в лидеры.

В 4кв24 OpenAI внедрили много полезного – холст, концепцию проектов, куда можно интегрировать окружение контекста (файлы, инструкции, материалы и т.д.), они наконец то внедрили вполне функциональный и работающий поиск.

Гибкость ChatGPT вне конкуренции. Ни одна LLM не предполагает настолько проработанной и гибкой среды, где можно настраивать собственные GPT по инструкциям, имея при этом инструменты верификации результатов через доступ к сети.

Продолжение следует.



group-telegram.com/spydell_finance/6932
Create:
Last Update:

Какие большие языковые модели сейчас лучшие на рынке?

Сжатая квинтэссенция двух лет работы с LLM и попытки их адаптировать в рабочие процессы.

Так все быстро меняется, что текущий срез окажется неактуальным практически сразу после выхода.

Я пока опущу аудио, фото и видео генерацию, т.к. не являюсь художником, монтажером, режиссером, дизайнером или музыкантом, чтобы делать профессиональный и компетентные выводы.

При этом я разрабатываю и внедряю передовые аналитические и информационные решения и в этом контексте есть, что сказать.

С точки зрения внедрения LLM непосредственно в собственные рабочие проекты – прогресса нет никакого за два года, весьма специфические и сложные задачи (здесь требуется серия отдельных материалов, чтобы обосновать все проблемы и ограничения внедрения LLM в бизнес и/или научные проекты).

Сейчас очень краткий разбор того, какие наиболее сильные LLM присутствуют на рынке, т.к. я их пробовал все. Полноценный обзор потребует серии статьей на 5-7 материалов, но пока нет времени на это.

▪️Главные разочарования 2024 года: Perplexity и … Claude!

● Perplexity был очень крут в 2023, представив революционный на тот момент инструмент умного поиска, но они застыли на уровне 2023, не представив ничего существенного за год при сильном прогрессе конкурентов. Perplexity потерял гибкость в глубокой настройке выходного результата и плохо следует инструкциям в разделе «Spaces». Сейчас Perplexity выдает посредственные результаты в сравнении с возможностями конкурентов, не оправдывая стоимость подписки.

● Claude хорош во всем, за исключением того, что нет выхода в сеть. LLM без актуальной инфы – это архаика в 2025. Claude по сути теряет смысл в платной подписке при всех своих преимуществах, не позволяя актуализировать и верифицировать выходную генерацию токенов.

▪️Главные открытия или успех в 2024 году: феерический взлет DeepSeek, прогресс Google и инновации OpenAI.

DeepSeek – феноменален, это за гранью понимания того, как можно было сделать в ограниченном бюджете и ресурсе настолько волшебную LLM. DeepSeek вне всяких сомнений вызывает восторг и удивление. Прорыв китайцев, который не просто сократил отставание от ведущих американских LLM, но вполне конкурирует и даже опережает их. DeepSeek R1 однозначно намного сильнее, быстрее и лучше, чем последние разработки Anthropic, Google или даже OpenAI, за исключением o1 и o1 pro.

Китайцы в декабре 2024 вызвали настоящую панику среди технологического сегмента США, никто не понимал, как им удалось сделать такой эффективный проект. Ожидаю новых чудес от китайцев.

Google – это история о том, как очень мощное инженерное подразделение оказалось в тени безумных маркетологов и подразделения, ответственного за публичное внедрение и адаптацию LLM. Суть в том, что основа LLM от Google очень хороша (прогресс за год сильный), но в публичной версии так много ограничений и цензуры, что просто неприемлема для работы.

Я использую исключительно среду для разработчиков Google AI Studio и бета версии непубличных моделей типа Gemini 2.0 Flash Experimental и Gemini 2.0 Flash Thinking. Сильное преимущество Google над всеми остальными – очень четкое следование инструкциям. Если в начале 2024 эффективность LLM от Google была не выше 1% (1 из 100 вопросов был на уровне или выше конкурентов), сейчас ближе к 25%, что уже приемлемо для работы.

OpenAI – все еще остается неоспоримым лидером по совокупности факторов. Да, ChatGPT 4o безнадежно устарел и архаичен сейчас, но в конце 2024 они выпустили мощные модели o1 и o1 pro, которые снова вырвались в лидеры.

В 4кв24 OpenAI внедрили много полезного – холст, концепцию проектов, куда можно интегрировать окружение контекста (файлы, инструкции, материалы и т.д.), они наконец то внедрили вполне функциональный и работающий поиск.

Гибкость ChatGPT вне конкуренции. Ни одна LLM не предполагает настолько проработанной и гибкой среды, где можно настраивать собственные GPT по инструкциям, имея при этом инструменты верификации результатов через доступ к сети.

Продолжение следует.

BY Spydell_finance


Warning: Undefined variable $i in /var/www/group-telegram/post.php on line 260

Share with your friend now:
group-telegram.com/spydell_finance/6932

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Telegram was co-founded by Pavel and Nikolai Durov, the brothers who had previously created VKontakte. VK is Russia’s equivalent of Facebook, a social network used for public and private messaging, audio and video sharing as well as online gaming. In January, SimpleWeb reported that VK was Russia’s fourth most-visited website, after Yandex, YouTube and Google’s Russian-language homepage. In 2016, Forbes’ Michael Solomon described Pavel Durov (pictured, below) as the “Mark Zuckerberg of Russia.” Markets continued to grapple with the economic and corporate earnings implications relating to the Russia-Ukraine conflict. “We have a ton of uncertainty right now,” said Stephanie Link, chief investment strategist and portfolio manager at Hightower Advisors. “We’re dealing with a war, we’re dealing with inflation. We don’t know what it means to earnings.” In 2018, Russia banned Telegram although it reversed the prohibition two years later. Founder Pavel Durov says tech is meant to set you free Under the Sebi Act, the regulator has the power to carry out search and seizure of books, registers, documents including electronics and digital devices from any person associated with the securities market.
from it


Telegram Spydell_finance
FROM American