Telegram Group & Telegram Channel
Продолжаем изучение аспектов истории с ДипСиком. Вчера обсудили, почему упала Энвидия. Не потому что кто-то чего-то испугался в области ИИ, а потому что теперь все уйдут на Хуавей, раз доказано, что самая дорогая четырёхнанометровая Энвидия не особо нужна.

Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.

Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.

Как обычно, начнём издалека.

Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.

Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?

Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.

А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.

Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.

То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!

Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.

Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.

💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.

Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?

Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.

Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.



group-telegram.com/DmitryMKulish/650
Create:
Last Update:

Продолжаем изучение аспектов истории с ДипСиком. Вчера обсудили, почему упала Энвидия. Не потому что кто-то чего-то испугался в области ИИ, а потому что теперь все уйдут на Хуавей, раз доказано, что самая дорогая четырёхнанометровая Энвидия не особо нужна.

Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.

Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.

Как обычно, начнём издалека.

Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.

Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?

Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.

А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.

Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.

То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!

Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.

Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.

💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.

Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?

Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.

Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.

BY Старик и Лошадь 塞翁失馬





Share with your friend now:
group-telegram.com/DmitryMKulish/650

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

NEWS However, the perpetrators of such frauds are now adopting new methods and technologies to defraud the investors. False news often spreads via public groups, or chats, with potentially fatal effects. Channels are not fully encrypted, end-to-end. All communications on a Telegram channel can be seen by anyone on the channel and are also visible to Telegram. Telegram may be asked by a government to hand over the communications from a channel. Telegram has a history of standing up to Russian government requests for data, but how comfortable you are relying on that history to predict future behavior is up to you. Because Telegram has this data, it may also be stolen by hackers or leaked by an internal employee. "The argument from Telegram is, 'You should trust us because we tell you that we're trustworthy,'" Maréchal said. "It's really in the eye of the beholder whether that's something you want to buy into."
from de


Telegram Старик и Лошадь 塞翁失馬
FROM American