Продолжаем изучение аспектов истории с ДипСиком. Вчера обсудили, почему упала Энвидия. Не потому что кто-то чего-то испугался в области ИИ, а потому что теперь все уйдут на Хуавей, раз доказано, что самая дорогая четырёхнанометровая Энвидия не особо нужна.
Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.
Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.
Как обычно, начнём издалека.
Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.
Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?
Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.
А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.
Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.
То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!
Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.
Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.
💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.
Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?
Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.
Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.
Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.
Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.
Как обычно, начнём издалека.
Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.
Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?
Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.
А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.
Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.
То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!
Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.
Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.
💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.
Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?
Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.
Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.
group-telegram.com/DmitryMKulish/650
Create:
Last Update:
Last Update:
Продолжаем изучение аспектов истории с ДипСиком. Вчера обсудили, почему упала Энвидия. Не потому что кто-то чего-то испугался в области ИИ, а потому что теперь все уйдут на Хуавей, раз доказано, что самая дорогая четырёхнанометровая Энвидия не особо нужна.
Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.
Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.
Как обычно, начнём издалека.
Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.
Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?
Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.
А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.
Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.
То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!
Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.
Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.
💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.
Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?
Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.
Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.
Инновации – они такие инновации. Иногда они убивают мечту с помощью холодных фактов. За три торговых дня Энвидия отскочить не смогла и продолжает рисовать фигуру сбитой галки. Так что нужно её продавать и можно шортить. Попомните мой прогноз.
Но отряхнём же прах скушного жестокого бизнеса с наших нежных культурных стоп и поговорим о последствиях истории ДипСика для нас, учёных, и для всей науки в целом.
Как обычно, начнём издалека.
Может ли кто-нибудь ответить, почему Энвидия упала именно в понедельник 27-го января? Все значимые календарные события вроде бы произошли гораздо ранее:
🔹 весь прошлый год команда ДипСик обильно публиковалась, рассказывая, что она делает,
🔹 27-го декабря было опубликовано полное техническое описание бота DeepSeek-V3,
🔹 10-го января V3 был выложен в открытый доступ,
🔹 20-го января был выложен тот самый DeepSeek-R1, из-за которого весь сыр-бор,
🔹 22-го января были выложены независимые некитайские тест-раны, сообщающие, что R1 лучше ЧатаГПТ.
Так почему же продавцы Энвидии ждали именно 27го? Обычно продавцы продают по первому трубному зову. Что такого случилось в выходные 25-26?
Ответ радует душу учёного: 26-го была опубликована первая и решительная статья про R1 где было обьяснено, что и как китайские товарищи делали. Скриншот титула этой статьи расположен у нас на картинке в левом нижнем углу. После этой статьи стало понятно, что мир, как мы его знали, подходит к концу и возврата не будет. Подробности революции смотрите в предыдущем посте.
А сейчас возрадуемся за учёных. Поздравляем! Теперь вы знаете, что ваши публикации читает весь мир и если там написано что-то дельное, то последствия превышают триллион долларов. Это приятно и полезно! Проглядывает потенциал монетизации.
Также становится очевидна важность учёных в разборках на важную тему, сколько же на самом деле этот DeepSeek сто́ит. Ведь журналисты же, конечно, всё перепутали. Они по-другому не умеют. Они нам трубят о цифре 5 миллионов долларов, а эта цифра вообще не про R1 — она про V3. Итак:
🔹 пре-тренинг V3 занял 2,664,000 GPU-часов на H100 на 14.8 триллионах токенов
🔹 пост-тренинг (SFT+RL+дистилляция) V3 занял 5,000 GPU-часов
🔹 главная тонкость в том, что V3 дистиллировали на R1, которая выложена в открытый доступ! Если бы R1 не было, то дистиллировать пришлось бы на ЧатГПТ, а это запрещено американцами.
То есть, сколько стоила R1 никто на самом деле не знает и даже не обсуждает. Наверняка R1 стоила не 5, а 100 миллионов и наверняка её тайно дистиллировали на ЧатГПТ. Но это всё не важно!
Важно, что теперь любая новая модель может дистиллироваться на R1 за 5 миллионов. И делаться это будет на архитектуре и в экосистеме Хуавей! Смотрите предыдущий пост, чтобы понять, почему это важно.
Короче, теперь быть учёным и писать статьи снова модно, престижно, да к тому же и выгодно.
💥💥💥 Ещё одно немаловажное замечание! Все свои статьи группа DeepSeek публикует на нерецензируемом портале arXiv. И, прикиньте, народ там чудненько всё читает и делают очень далеко идущие выводы. На триллионы, как мы обсудили, долларов.
Это как же? Это что же? А как же рецензирование, которое длится полгода и требует убеждения четырёх неизвестных профессионалов? А как же институт репутации? А как же импакт-фактор журнала? Как будут считать наукометрику такой статьи?
Я бы мог тут долго восторгаться и иронизировать, но учёные уже поняли, о чём я. Добавляю последнюю вишенку для этого торта: вчера в редакционном комментарии по ДипСик НЕЙЧЕР процитировала АРХИВ!!! Я даже специально заскриншотил. Мне кажется, это впервые в истории человечества.
Небеса рухнули на землю. Мир, как мы его знали, подходит к концу. Теперь учёные утонут в потоках нерецензируемых статей. Но зато копирайт умрёт и мир станет чище. Элбаканизм побеждает! Интересно, что нас в нём ждёт.
BY Старик и Лошадь 塞翁失馬


Share with your friend now:
group-telegram.com/DmitryMKulish/650