Всё сводится к трём ключевым идеям:
1) Использовать Transformer Engine подменяет стандартные блоки на оптимизированные версии: меньше памяти, быстрее матричные операции, поддержка FP8/FP4. Это сразу увеличивает скорость обучения и инференса.
2) Масштабировать обучение до миллиардов параметров
Через FSDP и гибридные режимы параллелизма можно разнести модель по нескольким GPU или узлам. И главное, конфигурация уже готова, не нужно собирать всё вручную.
3) Экономить память за счёт sequence packing
Обычно биологические последовательности сильно различаются в длине, и половина батча забита паддингами. Packing позволяет «сжимать» батч, убирая пустые токены, итог: выше скорость, меньше VRAM.
Писать CUDA-ядра вручную никто не хочет. BioNeMo Recipes позволяют использовать привычный стек PyTorch + HuggingFace, но при этом получать производительность уровня «больших» фреймворков.
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/
@ai_machinelearning_big_data
#NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👌35❤20👍15🔥4🦄3❤🔥1👏1
Еще одно место, где можно бесплатно попробовать топовую модель.
LMArena добавила в список моделей Nano Banana Pro, у них она называется
gemini-3-pro-image-review(nano-banana-pro) .Выбор модели доступен в режимах Direct Chat (генерация на одной выбранной модели) и Side-by-Side (генерация на 2-х выбранных моделях для сравнения результата).
Поддерживается как text-to-image, так и загрузка рефересных картинок.
Единственный минус - нет выбора разрешения (1К, 2K или 4K) и соотношения сторон.
Про лимиты на количество запусков информации нет, запускайте, пока запускается.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49❤22🥰7🦄6
Miles - фреймворк для RL-обучения от команды LMSYS ORG, ориентированный на энтерпрайз-уровень.
Если вы следите за опенсорс разработками, вы наверняка слышали о предшественнике этой системы, проекте slime. Это легкий инструмент, который используют во многих современных пайплайнов пост-трейна. На нем, кстати, запускали GLM-4.6.
Slime доказал, что легковесный дизайн работает, и Miles делает следующий шаг - масштабное обучение архитектур MoE и поддержка тяжелых промышленных нагрузок.
Miles предлагает то, что называют "True On-Policy". Раньше между тренировкой и инференсом часто возникало расхождение. Теперь же, благодаря инфраструктурному подходу, LMSYS добилась нулевой дивергенции. Это стало возможным благодаря использованию Flash Attention 3, библиотеки DeepGEMM и ядер от Thinking Machines Lab, работающих в связке с
torch.compile.Вторая особенность - в использовании спекулятивного декодирования. Обычно в RL черновая модель замораживается, что мешает ей следовать политике целевой модели. LMSYS добавили онлайн-обучение черновой модели.
Результаты на тестах положительные: ускорение генерации более чем на 25%, особенно на поздних стадиях обучения.
Для энтерпрайза память - это деньги. В Miles включили механизмы, предотвращающие падение системы при некритичных ошибках OOM и исправили чрезмерное потребление памяти в FSDP.
В дорожной карте проекта обещают поддержку мультимодального обучения, совместимость со SGLang v2 и расширенное спекулятивное декодирование.
@ai_machinelearning_big_data
#AI #ML #RL #Miles #LMSYS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93❤🔥12❤11🔥9🦄4💋1💘1
Андрей Карпаты
Его идея в том, что вместо того, чтобы задавать вопрос одной LLM, вы можете объединить их в «Совет моделей».
LLM Council - это простое локальное веб-приложение, с интерфейсом как у ChatGPT, но с той разницей, что запрос отправляется через Openrouter нескольким LLM. Полученные ответы перекрестно оцениваются и ранжируются, и, наконец, «модель-председатель совета» формирует окончательный ответ.
Более подробно процесс выглядит так:
Запрос отправляется всем моделям по отдельности, и их ответы собираются. Ответы каждой модели отображаются в отдельной вкладке, чтобы можно было их посмотреть вручную.
Каждая модель получает ответы других моделей. При этом идентификаторы анонимизированы, чтобы исключить «игру в любимчиков» при оценке чужих результатов. На этом этапе ответы ранжируются их по точности и глубине анализа.
Модель-председатель принимает все ответы моделей и компилирует их в единый окончательный ответ.
⚠️ Для использования нужен API-ключ OpenRouter.
@ai_machinelearning_big_data
#AI #ML #LLMCouncil #Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤69🔥33👍27🤣18🦄6🤨1
🚀 Яков и Партнёры вместе с Yandex B2B Tech выпустили отчёт о применении облачных технологий в бизнесе.
▶️ Облако реально увеличивает прибыль: почти половина компаний отмечает эффект свыше 3% EBITDA, а в цифровых отраслях — более 5%.
▶️ Расходы на облако растут: у половины организаций они уже превышают 5% ИТ-бюджета, а более 30% планируют их увеличить.
▶️ Российский рынок облаков пока умерен по инвестициям в сравнении с мировыми игроками, поэтому потенциал роста огромен.
▶️ Главный критерий выбора провайдера — качество технологий и сервисов, а не цена. Это признак зрелого рынка.
▶️ Гибридная модель становится стандартом: свыше 70% компаний используют одновременно public cloud и on-premises, PaaS и SaaS проникли к 65–66%.
▶️ PaaS — главный драйвер внедрения ИИ. Компании с развитым облаком быстрее запускают AI-проекты благодаря масштабируемым ресурсам.
Облако — критическая база для цифровой трансформации и ИИ. Бизнес всё осознаннее выбирает провайдера, рассматривая облако как фундамент стратегических технологий.
Облако — критическая база для цифровой трансформации и ИИ. Бизнес всё осознаннее выбирает провайдера, рассматривая облако как фундамент стратегических технологий.
Please open Telegram to view this post
VIEW IN TELEGRAM
yakovpartners.ru
Яков и Партнёры - Внедрение облачных технологий значимо увеличивает прибыль компаний
При этом существует высокая положительная корреляция между активным использованием облачных технологий и внедрением ИИ
❤22🤣10👍9🔥5🤬4☃2
The Information опубликовала внутреннее письмо Сэма Альтмана, и его тон сильно отличается от привычного оптимизма OpenAI.
CEO прямо предупреждает команду: впереди могут быть серьёзные вызовы.
1. Google сделал резкий рывок
Альтман признаёт, что Google заметно ускорился в области ИИ.
Теперь OpenAI - не компания с комфортным отрывом от конкурентов, а участник гонки, которому снова нужно догонять.
2. Рост OpenAI может существенно замедлиться
По данным источников, к 2026 году рост выручки может уменьшится в разы.
Для компании, которая только что росла взрывными темпами, это серьёзный сигнал.
3. Внутри OPENAI ощущается напряжение
Атмосферу описывают как *«rough vibes»*: меньше уверенности в своих силах, больше осторожности.
Команда впервые за долгое время чувствует давление и неопределённость.
Фаза бурного роста заканчивается, начинается период конкуренции и стратегической выносливости.
OpenAI остаётся сильнейшим игроком, но теперь марафон важнее спринта.
https://www.theinformation.com/articles/openai-ceo-braces-possible-economic-headwinds-catching-resurgent-google
@ai_machinelearning_big_data
#AI #OpenAI #Google #TechNews
Please open Telegram to view this post
VIEW IN TELEGRAM
👍70❤22🤣17🔥7🗿6😁2🦄2😢1
👑 Gemini 3 Pro теперь лидирует в IQ-тестах, набрав внушительные 130 баллов, опережая все прочие LLM!
По шкале IQ такой результат помещает её в число примерно 2% людей с наивысшим интеллектом среди всех, кто когда-либо проходил подобные тесты.
А в тесте норвежского отделения Mensa модель показала эквивалент 142 баллов IQ, что соответствует уровню лишь 0,3% самых интеллектуальных людей на планете.
@ai_machinelearning_big_data
#Gemini #google
По шкале IQ такой результат помещает её в число примерно 2% людей с наивысшим интеллектом среди всех, кто когда-либо проходил подобные тесты.
А в тесте норвежского отделения Mensa модель показала эквивалент 142 баллов IQ, что соответствует уровню лишь 0,3% самых интеллектуальных людей на планете.
@ai_machinelearning_big_data
#Gemini #google
❤75🔥37👍19😁10🗿7🦄4
Более 14 тысяч участников – школьники, студенты и опытные айтишники - боролись за звание лучших в алгоритмическом и робототехническом программировании True Tech Champ, но в финал в Москве выбились только 350 из них.
Заключительный этап прошел в формате шоу-битвы роботов в гибридной реальности:
Первое место и 1 млн рублей в первом треке забрал Максим Гороховский из Москвы. Во втором треке победу одержала команда «Зато по ГОСТу» - 4 млн рублей разделили Андрей и Михаил Семенищевы. Общий призовой фонд составил 10 млн рублей.
«Турниры развивают умение работать под давлением, дисциплину и креативность, а также становятся площадкой для ИТ-комьюнити, где единомышленники общаются и обмениваются опытом. Такой нетворкинг может стать основой для создания перспективных технологических проектов», - прокомментировал генеральный директор МТС Web Services Павел Воронин.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤35😁18👍10🔥6👌5🦄3🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
📡 Amazon Leo: новый конкурент Starlink
Amazon представил первый рабочий образец своей новой спутниковой антенны - Amazon Leo Ultra - и открыл *ограниченный доступ* для корпоративных клиентов.
— до 1 Гбит/с на скачивание
— до 400 Мбит/с на загрузку
— работает на собственном чипе Leo Silicon
Проект Kuiper теперь называется Amazon Leo. Компания строит сеть из 3000+ спутников на низкой орбите для быстрого широкополосного интернета.
Антенна использует **фазированную решётку** - она электронно направляет луч и отслеживает спутники без моторов, сохраняя связь даже при вибрациях и дожде.
Но Amazon сильно отстаёт от Starlink:
— Starlink уже имеет 9000+ спутников,
— у Amazon — менее 200, хотя запуски продолжаются.
Важно: высокая скорость на бумаге работает только при плотной сети, хорошем спектре и мощной наземной инфраструктуре.
Amazon делает серьёзный шаг, но догнать Starlink будет очень сложно.
https://www.aboutamazon.com/news/amazon-leo/amazon-leo-satellite-internet-ultra-pro
@ai_machinelearning_big_data
#AmazonLeo #ProjectKuiper #SatelliteInternet #LEO #Amazon
Amazon представил первый рабочий образец своей новой спутниковой антенны - Amazon Leo Ultra - и открыл *ограниченный доступ* для корпоративных клиентов.
— до 1 Гбит/с на скачивание
— до 400 Мбит/с на загрузку
— работает на собственном чипе Leo Silicon
Проект Kuiper теперь называется Amazon Leo. Компания строит сеть из 3000+ спутников на низкой орбите для быстрого широкополосного интернета.
Антенна использует **фазированную решётку** - она электронно направляет луч и отслеживает спутники без моторов, сохраняя связь даже при вибрациях и дожде.
Но Amazon сильно отстаёт от Starlink:
— Starlink уже имеет 9000+ спутников,
— у Amazon — менее 200, хотя запуски продолжаются.
Важно: высокая скорость на бумаге работает только при плотной сети, хорошем спектре и мощной наземной инфраструктуре.
Amazon делает серьёзный шаг, но догнать Starlink будет очень сложно.
https://www.aboutamazon.com/news/amazon-leo/amazon-leo-satellite-internet-ultra-pro
@ai_machinelearning_big_data
#AmazonLeo #ProjectKuiper #SatelliteInternet #LEO #Amazon
👍69❤16🔥11😨6🤬2🤓1
Anthropic выпустила Claude Opus 4.5, которую назвала «лучшей в мире».
Модель по тестам выбивает топовые результаты в программировании и работе с агентами. Говорят, что она даже превзошла всех кандидатов-людей на внутреннем тесте.
Модель подешевела. Цена за 1 млн. токенов теперь составляет $5 на вход и $25 на выход.
Для разработчиков добавили новый параметр (low, high и medium), позволяющий балансировать между скоростью ответа и качеством генерации.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤58🔥32👍21🥰7🤣6🤔3🤬3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Исәнмесез! Встречайте новый VK JT Meetup: ML + Java!
4 декабря VK приглашает ML-инженеров и Java-разработчиков Казани на офлайн-встречу.
В программе:
— Практические доклады от экспертов VK: управление облаком One-cloud, запуск генеративного поиска в мессенджере и выкатка RAG в прод
— Два потока на выбор: нетворкинг с настольными играми или решение реальных кейсов от VK с призами
Общайтесь с экспертами, находите лучшие решения и оставайтесь на афтепати: фуршет, нетворкинг, настолки и свободное общение.
Только офлайн, в Big Twin Arena.
🎟 Участие бесплатное, регистрация на сайте.
4 декабря VK приглашает ML-инженеров и Java-разработчиков Казани на офлайн-встречу.
В программе:
— Практические доклады от экспертов VK: управление облаком One-cloud, запуск генеративного поиска в мессенджере и выкатка RAG в прод
— Два потока на выбор: нетворкинг с настольными играми или решение реальных кейсов от VK с призами
Общайтесь с экспертами, находите лучшие решения и оставайтесь на афтепати: фуршет, нетворкинг, настолки и свободное общение.
Только офлайн, в Big Twin Arena.
🎟 Участие бесплатное, регистрация на сайте.
👍26🥱12❤11🤗6🤣4🥰3
Media is too big
VIEW IN TELEGRAM
Shanghai AI Lab натренировал семейство моделей P1 для решения сложнейших физических задач. Флагманская модель P1-235B-A22B добилась исторического результата, став первой открытой моделью, которая решила задачи Международной олимпиады по физике 2025 года на уровень золотой медали.
P1 сравнялась на физическом бенче HiPhO по количеству медалей с Gemini-2.5-Pro и обошла GPT-5. Основой успеха стала мультиагентная система PhysicsMinions, которая итеративно проверяет и улучшает решения, анализируя их логику и физическую состоятельность.
Весь проект P1, включая сами модели и бенчмарки, опубликован в открытом доступе.
prime-rl.github.io
Техногигант планирует в 1000 раз нарастить свои вычислительные мощности для ИИ в течение следующих 4-5 лет. По словам топ-менеджеров, Google уже вынуждена удваивать серверные емкости для ИИ каждые полгода, чтобы справляться с растущей нагрузкой.
Руководство Google считает, что риск недоинвестирования в инфраструктуру сейчас выше, чем риск перерасхода средств. План расширения опирается на три элемента: более тесную интеграцию аппаратного и программного обеспечения, повышение эффективности моделей и использование кастомных чипов.
cnbc.com
Сервис расширили функцией генерации слайдов на основе загруженных источников. Инструмент подойдет для быстрого структурирования информации и создания черновиков презентаций или визуально улучшения уже существующих материалов.
Слайды доступны для скачивания в формате PDF, экспорт в Google Slides и PowerPoint уже находится в разработке. За работу новой функции отвечает Nano Bana Pro.
Лимиты на использование зависят от типа аккаунта пользователя.
NotebookLM в сети Х
WorldGen — система генерации полностью интерактивных 3D-мирой на основе простых текстовых запросов. Технология использует процедурную логику и диффузионные модели для создания детализированных и стилистически выдержанных локаций размером до 50x50 метров.
Итоговые сцены WorldGen, согласно демо-роликам, не просто статичны, а готовы к навигации и взаимодействию. Созданные миры совместимы с игровыми движками Unity и Unreal и не требуют дополнительных конвертаций или сложной настройки рендеринга.
Проект находится на стадии исследования и пока недоступен для широкого использования.
roadtovr.com
Игровая студия анонсировала экспериментальный проект Teammates, который меняет взаимодействие с неигровыми персонажами. Технология на базе генеративного ИИ позволяет NPC понимать естественную речь и действовать как участники процесса, а не просто скриптовые боты.
В рамках прототипа, созданного на основе шутера от первого лица, игроку помогают два ИИ-напарника и голосовой ассистент Джаспар. Они способны реагировать на голосовые команды: подсвечивать цели, предоставлять информацию о сюжете, изменять игровые настройки или ставить игру на паузу. Система анализирует контекст и действия игрока, обеспечивая динамическую реакцию персонажей в реальном времени.
Ubisoft говорит, что проект уже прошел закрытое тестирование. По мнению CEO компании, ИИ станет для индустрии революцией, сравнимой с переходом игр от 2D к 3D.
news.ubisoft.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤41👍19🔥16🦄2
