Telegram Group & Telegram Channel
Продолжаем изучение аспектов истории с ДипСиком. Вчера обсудили, почему упала Энвидия. Не потому что кто-то чего-то испугался в области ИИ, а потому что теперь все уйдут на Хуавей, раз доказано, что самая дорогая четырёхнанометровая Энвидия не особо нужна.

Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.

Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.

Как обычно, начнём издалека.

Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.

Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?

Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.

А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.

Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.

То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!

Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.

Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.

💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.

Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?

Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.

Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.



group-telegram.com/DmitryMKulish/650
Create:
Last Update:

Продолжаем изучение аспектов истории с ДипСиком. Вчера обсудили, почему упала Энвидия. Не потому что кто-то чего-то испугался в области ИИ, а потому что теперь все уйдут на Хуавей, раз доказано, что самая дорогая четырёхнанометровая Энвидия не особо нужна.

Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.

Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.

Как обычно, начнём издалека.

Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.

Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?

Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.

А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.

Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.

То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!

Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.

Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.

💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.

Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?

Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.

Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.

BY Старик и Лошадь 塞翁失馬





Share with your friend now:
group-telegram.com/DmitryMKulish/650

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Lastly, the web previews of t.me links have been given a new look, adding chat backgrounds and design elements from the fully-features Telegram Web client. Sebi said data, emails and other documents are being retrieved from the seized devices and detailed investigation is in progress. You may recall that, back when Facebook started changing WhatsApp’s terms of service, a number of news outlets reported on, and even recommended, switching to Telegram. Pavel Durov even said that users should delete WhatsApp “unless you are cool with all of your photos and messages becoming public one day.” But Telegram can’t be described as a more-secure version of WhatsApp. In December 2021, Sebi officials had conducted a search and seizure operation at the premises of certain persons carrying out similar manipulative activities through Telegram channels. But because group chats and the channel features are not end-to-end encrypted, Galperin said user privacy is potentially under threat.
from cn


Telegram Старик и Лошадь 塞翁失馬
FROM American