Telegram Group & Telegram Channel
Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 



group-telegram.com/sdc_channel/1700
Create:
Last Update:

Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 

BY СИБУР Цифровой





Share with your friend now:
group-telegram.com/sdc_channel/1700

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

To that end, when files are actively downloading, a new icon now appears in the Search bar that users can tap to view and manage downloads, pause and resume all downloads or just individual items, and select one to increase its priority or view it in a chat. In 2018, Russia banned Telegram although it reversed the prohibition two years later. Telegram, which does little policing of its content, has also became a hub for Russian propaganda and misinformation. Many pro-Kremlin channels have become popular, alongside accounts of journalists and other independent observers. Emerson Brooking, a disinformation expert at the Atlantic Council's Digital Forensic Research Lab, said: "Back in the Wild West period of content moderation, like 2014 or 2015, maybe they could have gotten away with it, but it stands in marked contrast with how other companies run themselves today." So, uh, whenever I hear about Telegram, it’s always in relation to something bad. What gives?
from kr


Telegram СИБУР Цифровой
FROM American