Telegram Group & Telegram Channel
Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 



group-telegram.com/sdc_channel/1700
Create:
Last Update:

Нас интересует всё, что связано с развитием ИИ. Поэтому мы ну никак не могли пройти мимо нашумевшего соперника ChatGPT DeepSeek. 

Что это
Китайская лаборатория создала мощную рассуждающую модель DeepSeek-V3 с 671 млрд параметров. По возможностям она сравнима с GPT-4 или Claude 3.5. Недавно компания выпустила новую, ещё более умную версию ИИ — DeepSeek-R1.

В чём фишка
Функции у модели те же, что и у конкурентов, но на создание ушло намного меньше денег и времени — примерно 5,58 млн долларов, и обучали DeepSeek 55 дней. Для сравнения: на тренировку Claude 3.5 Sonnet ушло несколько десятков миллионов долларов.

А что нового
Отличие R1 в том, что создатели использовали обучение с подкреплением, применяя новаторские методы для ускорения этого процесса: тренировали рассуждать ИИ, перед тем как выдать ответ, действовать по методу проб и ошибок. И у них удалось сделать дешёвую, но эффективную рассуждающую модель.
 
Что такое рассуждающие модели
Это большие языковые модели (LLM — Large Language Model), обученные на датасетах, которые содержат не только пары «вопрос — ответ», но и пошаговую логику размышлений. Они естественным образом разбивают проблемы на мелкие части и используют подход «цепочки рассуждений», исправление ошибок и пробуют несколько стратегий перед ответом. 
 
Прогнозы на будущее
Если можно повышать качество модели, просто выделяя ей больше вычислительной мощности, то требования к вычислительным ресурсам (GPU) будут расти. Рассуждающие языковые модели смогут превзойти уровень экспертов в области математики, программирования, физики и химии и стать помощниками для инженеров и учёных. 

BY СИБУР Цифровой





Share with your friend now:
group-telegram.com/sdc_channel/1700

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Russians and Ukrainians are both prolific users of Telegram. They rely on the app for channels that act as newsfeeds, group chats (both public and private), and one-to-one communication. Since the Russian invasion of Ukraine, Telegram has remained an important lifeline for both Russians and Ukrainians, as a way of staying aware of the latest news and keeping in touch with loved ones. Telegram has become more interventionist over time, and has steadily increased its efforts to shut down these accounts. But this has also meant that the company has also engaged with lawmakers more generally, although it maintains that it doesn’t do so willingly. For instance, in September 2021, Telegram reportedly blocked a chat bot in support of (Putin critic) Alexei Navalny during Russia’s most recent parliamentary elections. Pavel Durov was quoted at the time saying that the company was obliged to follow a “legitimate” law of the land. He added that as Apple and Google both follow the law, to violate it would give both platforms a reason to boot the messenger from its stores. Also in the latest update is the ability for users to create a unique @username from the Settings page, providing others with an easy way to contact them via Search or their t.me/username link without sharing their phone number. DFR Lab sent the image through Microsoft Azure's Face Verification program and found that it was "highly unlikely" that the person in the second photo was the same as the first woman. The fact-checker Logically AI also found the claim to be false. The woman, Olena Kurilo, was also captured in a video after the airstrike and shown to have the injuries. The S&P 500 fell 1.3% to 4,204.36, and the Dow Jones Industrial Average was down 0.7% to 32,943.33. The Dow posted a fifth straight weekly loss — its longest losing streak since 2019. The Nasdaq Composite tumbled 2.2% to 12,843.81. Though all three indexes opened in the green, stocks took a turn after a new report showed U.S. consumer sentiment deteriorated more than expected in early March as consumers' inflation expectations soared to the highest since 1981.
from nl


Telegram СИБУР Цифровой
FROM American