Telegram Group & Telegram Channel
Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 



group-telegram.com/sdc_channel/1700
Create:
Last Update:

Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 

BY СИБУР Цифровой





Share with your friend now:
group-telegram.com/sdc_channel/1700

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

The Dow Jones Industrial Average fell 230 points, or 0.7%. Meanwhile, the S&P 500 and the Nasdaq Composite dropped 1.3% and 2.2%, respectively. All three indexes began the day with gains before selling off. Again, in contrast to Facebook, Google and Twitter, Telegram's founder Pavel Durov runs his company in relative secrecy from Dubai. At this point, however, Durov had already been working on Telegram with his brother, and further planned a mobile-first social network with an explicit focus on anti-censorship. Later in April, he told TechCrunch that he had left Russia and had “no plans to go back,” saying that the nation was currently “incompatible with internet business at the moment.” He added later that he was looking for a country that matched his libertarian ideals to base his next startup. Additionally, investors are often instructed to deposit monies into personal bank accounts of individuals who claim to represent a legitimate entity, and/or into an unrelated corporate account. To lend credence and to lure unsuspecting victims, perpetrators usually claim that their entity and/or the investment schemes are approved by financial authorities. If you initiate a Secret Chat, however, then these communications are end-to-end encrypted and are tied to the device you are using. That means it’s less convenient to access them across multiple platforms, but you are at far less risk of snooping. Back in the day, Secret Chats received some praise from the EFF, but the fact that its standard system isn’t as secure earned it some criticism. If you’re looking for something that is considered more reliable by privacy advocates, then Signal is the EFF’s preferred platform, although that too is not without some caveats.
from de


Telegram СИБУР Цифровой
FROM American