Telegram Group Search
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Если вы хотите не часовой просмотр, а резюме сегодняшнего обсуждения исполнения нацпроекта "Экология" , которое состоялось на заседании профильного комитета ГД РФ, то оно уже готово
И от Счетной Палаты
Вообще, конечно, история с реакцией рынков на новости о DeepSeek V3 и R1 это пример глупости помноженной на дилетантизм и истеричную природу массового сознания в эпоху кликбейт-экономики

Коротко по тезисам:

1. Нет, DeepSeek не «умнее на голову» всех в моделей. В разных бенчмарках результаты разные, но в среднем GPT-4o и Gemini-2 лучше. Можете посмотреть на ChatBot Arena, например (https://www.reddit.com/r/LocalLLaMA/comments/1i8u9jk/deepseekr1_appears_on_lmsys_arena_leaderboard/). Даже в результатах, опубликованных в статье авторов DeepSeek (https://github.com/deepseek-ai/DeepSeek-V3/blob/main/figures/benchmark.png) можно заметить, что в ряде тестов модель уступает, например, GPT-4o от мая 2024 года, то есть модели, которая в ChatBot Arena сейчас на 16-м месте.

2. Нет, на обучение DeepSeek не ушло 6 млн долларов «в 100 раз меньше, чем на GPT-4». В 6 млн долларов обошёлся финальный запуск обучения опубликованной модели. Тут не учитывались никакие предыдущие эксперименты, ни предыдущие версии модели, ни время людей. Чистый вычислительный бюджет на финальный запуск обучения. Эта сумма +/- такая же, как у моделей того же класса

3. Непонятно, за что пострадала Nvidia :)) Ну так-то, конечно, так им и надо, пускай снижают цены на железо, но учился-то DeepSeek на железках того самого Nvidia. И нет, теперь их не нужно меньше. И вычислительный бюджет на обучение там +/- обычный и на инференс такой большой модели (а это, напомню MoE с 671 млрд параметров, где при генерации токена используется 37 млрд параметров, то есть цена инференса там примерно как у 70B dense-модели) нужно много железа. И, естественно, успех DeepSeek отмасштабируют, вкинув ещё больше железа и сделав модель больше

4. Значит ли это, что модель плохая? Нет, модель очень хорошая. Мы с самого начала следим за коллегами из DeepSeek и с удовольствием использовали некоторые из их идей. Вообще, я бы сказал, что у нас в команде DeepSeek всегда рассматривалась как фаворит среди китайских моделей. DeepSeek лучше подавляющего большинства open-source-моделей, и это очень круто. Искренне рады за китайских коллег и за прогресс в области LLM-строения и машинного обучения в целом

5. В некоторых источниках пишут, что DeepSeek якобы полностью решил проблему «галлюцинаций». Nyet

Я думаю, что паника и шумиха случилась из-за того, что на западе обычно плохо знают про состояние дел в китайском ML, среди многих американских и европейских специалистов наблюдалось немного пренебрежительное и снисходительное отношение к Китаю в области ИИ. Дескать: ну что они там могут сделать, клепают свои низкокачественные плохо воспроизводимые работы, куда им с белым человеком тягаться? Всё это умножилось на антикитайскую риторику властей США, а при Трампе фокус на Китае как на главном противнике усилился. Помните истерическую статью Ашенбреннера? Теперь вот Гари Маркус вопит, требует наказать Цукерберга за Llama, дескать из-за опен-сорса китайцы украли все секреты. Это, конечно, типичный пример того, как валят с больной головы на здоровую. Виноваты в недостаточном прогрессе открытых моделей в США скорее люди типа Маркуса, со своей истерикой про опасности ИИ, запретительными и просто глупыми регуляторными инициативами и пр. «Знает кошка, чьё мясо съела»

Ну а в целом акции отрастут, ресурсы выделят, идеи получат широкое распространение, модели будут становиться лучше, прогресс не остановить (надеюсь)

Пусть расцветают сто цветов, пусть соперничают сто школ © Мао Цзэдун
Все, с кем давно знакомы, знают о том, что тема ИИ с момента просмотра нудного фильма ExMachina ( сколько же лет прошло?) одна из тех, которые постоянно держу в фокусе.
Поэтому подборка экспертного сообщества и пассивное в нем участие стараюсь сохранять.
После всеобщее бумаги многие спрашивали мнение. Делюсь, с моей точки зрения, наиболее интересными
Forwarded from Дизраптор
Хайповая пыль от ChinaGPT чуть утрамбовалась, многие умные люди высказались. Теперь могу заземлить самое ключевое на мой личный взгляд:

1. Обучение Дипсик стоило гораздо дороже 5,5 миллионов. Как минимум потому что фонд Лэн Вэньфэня (фаундера Дипсик) уже много лет занимается серьёзным квантовым трейдингом. У этих чуваков явно есть ИИ-мощности. Использовали ли их при обучении? Возможно. Считали ли? Конечно, нет Не факт. Да и в целом, одному Конфуцию известно, по каким хитрым китайским статьям провели затраты.

2. Так или иначе, китайский эйай-псиоп удался. Показать как нефритовый стержень обрушать гнусные капиталистические акции - done. Щёлкнуть по носу трамповскую MAGA - done. Полноценно включить Китай в ИИ-гонку - done. Завируситься на вау-цифрах, чтобы каждый второй поставщик личных данных на китайские сервера американец скачал аппку - done. +1000 социального рейтинга всем участвующим!

3. Даже если забить на эффект Джевонса (тут ещё бабка надвое сказала), американские ИИ-разрабы от случившегося только выиграют. По крайней мере стратегически, на длинной дистанции. American tech теперь может рассчитывать на ещё больше бабла, а выделятелям и пилителям этого бабла будет проще валидировать каждый новый транш в глазах избирателей ("А то страшный красный дракон кусь за бочок"). В американском AI бабло и раньше не особенно считали (см. "прибыльность OpenAI"), а теперь ваще не будут.

4. Несмотря на абзац выше, китайцы вполне могут выиграть ИИ-гонку в долгосроке, потому что:
- Помимо чипов важны люди. Гляньте разрез глаз любой национальной сборной по математике/информатике/программированию ЛЮБОЙ западной страны. А теперь представьте, что за монстры внутри Китая сидят.
- Помимо чипов важны данные для обучения. А данных у китайцев дохрена и больше. Причём не просто "текстов из интернетов", а "текстов из интернетов + транзакционных данных из Вичатов". И будьте уверены, на китайских ИИ-разрабов никто не подаст иск за незаконный ИИ-скрейпинг, как это делали американские СМИ и всякие реддиты. Про это рассказывал ещё Кай-Фу Ли в своих "Сверхдержавах".
- Кто бы ни выиграл, победят всё равно китайцы. Либо китайские китайцы из Ханчжоу, либо американские китайцы из Сан-Франа. Гы.

5. Несмотря на шутейки про бутылочные крышечки, Европа тоже подтянется и будет участвовать в гонке. И мы тоже будем. Не выиграем, но участвовать будем, с приемлемыми результатами. Потому что ИИ в любом случае будет коммодитизироваться. Дипсиковское удешевление лишь подтверждает это. Через Х лет решать будет не количество нанометров, не стоимость обучения и даже не данные, а способность коммерциализировать, полезность сценариев использования, гибкость внедрения. Сервис и бесшовность, в конце концов. Тут все могут побороться. А учитывая тренд на отрисовку всё более жёстких цифровых контуров по политическим границам... ну вы поняли.

Дизраптор
Please open Telegram to view this post
VIEW IN TELEGRAM
Что-то совсем не в эко каналах - а даже в тех, кто промышляет мемно - скроллинговой тактикой для тревожных пользователей тема пошла в раскрутку... Нет смысла одобрять или осуждать.
Думаем, как использовать.
Пятничное вечернее. Парадоксы.
Снова к теме перерабоки органики, циклического подхода "и прочая, и прочая"...
Пока российское сх роскошествует на отходах животноводства и даже местами пренебрегает ими, отдавая приоритет минеральным удобрениям как быстрому допингу для почв, некоторые вынуждены прибегать к экстремальным методам сбора сырья для органических удобрений ( хотя на фоне недавних новостей о воздушных шарах с навозом, десантированных северным соседом своему южному, читаем с удивлением).
Бизнес-идея безвозмездно.
Forwarded from Marketplace_biz
Please open Telegram to view this post
VIEW IN TELEGRAM
Сегодня три мероприятия подряд.
Иногда бывают такие дни.
Сначала - заседание Экосовета при Губернаторе Красноярского края. Моя задача на таких площадках - помочь найти дополнительную эффективность, сделать так, чтобы одним шагом - две цели. Тогда задачи сокращения отходов синергично решаются.
Сегодня обратила внимание участников, что в теме фед проекта "Чистый воздух" есть возможность исполнить и показатели фед проекта "Экономика замкнутого цикла" - перевод на пеллеты, биотопливо - вот и шаг к утилизации 25 процентов от всего объема отходав края. Такая работа в крае идет. Причем, что здорово, силами компаний, не гос средствами.

Далее - Круглый стол в рамках деловой программы на главной выставке авиатранспортной отрасли НАИС. Задачи, которые ставят для себя многие компании, в том числе и в части снижения отходов, и в целом в рамках устойчивого развития, и конкретно экологического блока не так просто исполнить, не ударяясь в гринвошинг и "одноклеточные" решения. Компании отрасли всерьез ставят вопросы экологизации. Будем взаимодействовать.

Ну и третье - заседание Совета по ЭЗЦ ТПП РФ. Родная тема - подтверждение производства. Ранее в системе ТПП РФ долго занималась этой темой по ряду постановлений Правительства (выше писала). Теперь ТПП будет подтверждать в контакте с Минпромторг использование вторичного сырья.
Новый предпринимательский круг впервые сталкивается с этим. Уровень вопросов со стороны бизнеса - минус 6 лет. В 2018-19 гг, заходя на подтверждение производства на территории РФ, происходили подобные дискуссии. Надеюсь, наш опыт будет полезен нашим членским организациям. Но им тоже надо уметь и хотеть воспользоваться. Так что важный разговор - и серьезные задачи
2025/02/06 01:39:34
Back to Top
HTML Embed Code: