Telegram Group & Telegram Channel
Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 



group-telegram.com/sdc_channel/1700
Create:
Last Update:

Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 

BY СИБУР Цифровой





Share with your friend now:
group-telegram.com/sdc_channel/1700

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Perpetrators of such fraud use various marketing techniques to attract subscribers on their social media channels. Telegram users are able to send files of any type up to 2GB each and access them from any device, with no limit on cloud storage, which has made downloading files more popular on the platform. Russians and Ukrainians are both prolific users of Telegram. They rely on the app for channels that act as newsfeeds, group chats (both public and private), and one-to-one communication. Since the Russian invasion of Ukraine, Telegram has remained an important lifeline for both Russians and Ukrainians, as a way of staying aware of the latest news and keeping in touch with loved ones. Crude oil prices edged higher after tumbling on Thursday, when U.S. West Texas intermediate slid back below $110 per barrel after topping as much as $130 a barrel in recent sessions. Still, gas prices at the pump rose to fresh highs. Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress.
from ye


Telegram СИБУР Цифровой
FROM American