Telegram Group & Telegram Channel
Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 



group-telegram.com/sdc_channel/1700
Create:
Last Update:

Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 

BY СИБУР Цифровой





Share with your friend now:
group-telegram.com/sdc_channel/1700

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

In December 2021, Sebi officials had conducted a search and seizure operation at the premises of certain persons carrying out similar manipulative activities through Telegram channels. The company maintains that it cannot act against individual or group chats, which are “private amongst their participants,” but it will respond to requests in relation to sticker sets, channels and bots which are publicly available. During the invasion of Ukraine, Pavel Durov has wrestled with this issue a lot more prominently than he has before. Channels like Donbass Insider and Bellum Acta, as reported by Foreign Policy, started pumping out pro-Russian propaganda as the invasion began. So much so that the Ukrainian National Security and Defense Council issued a statement labeling which accounts are Russian-backed. Ukrainian officials, in potential violation of the Geneva Convention, have shared imagery of dead and captured Russian soldiers on the platform. The regulator took order for the search and seizure operation from Judge Purushottam B Jadhav, Sebi Special Judge / Additional Sessions Judge. Recently, Durav wrote on his Telegram channel that users' right to privacy, in light of the war in Ukraine, is "sacred, now more than ever." As a result, the pandemic saw many newcomers to Telegram, including prominent anti-vaccine activists who used the app's hands-off approach to share false information on shots, a study from the Institute for Strategic Dialogue shows.
from fr


Telegram СИБУР Цифровой
FROM American