Telegram Group Search
🖥 NVIDIA опубликовали гайд: как масштабировать биологические модели.

Всё сводится к трём ключевым идеям:

1) Использовать Transformer Engine подменяет стандартные блоки на оптимизированные версии: меньше памяти, быстрее матричные операции, поддержка FP8/FP4. Это сразу увеличивает скорость обучения и инференса.

2) Масштабировать обучение до миллиардов параметров
Через FSDP и гибридные режимы параллелизма можно разнести модель по нескольким GPU или узлам. И главное, конфигурация уже готова, не нужно собирать всё вручную.

3) Экономить память за счёт sequence packing
Обычно биологические последовательности сильно различаются в длине, и половина батча забита паддингами. Packing позволяет «сжимать» батч, убирая пустые токены, итог: выше скорость, меньше VRAM.

Писать CUDA-ядра вручную никто не хочет. BioNeMo Recipes позволяют использовать привычный стек PyTorch + HuggingFace, но при этом получать производительность уровня «больших» фреймворков.

https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/

@ai_machinelearning_big_data

#NVIDIA
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👌3520👍15🔥4🦄3❤‍🔥1👏1
⚡️ Nano Banana Pro в LMArena.

Еще одно место, где можно бесплатно попробовать топовую модель.

LMArena добавила в список моделей Nano Banana Pro, у них она называется gemini-3-pro-image-review(nano-banana-pro) .

Выбор модели доступен в режимах Direct Chat (генерация на одной выбранной модели) и Side-by-Side (генерация на 2-х выбранных моделях для сравнения результата).

Поддерживается как text-to-image, так и загрузка рефересных картинок.

Единственный минус - нет выбора разрешения (1К, 2K или 4K) и соотношения сторон.

Про лимиты на количество запусков информации нет, запускайте, пока запускается.

🔜 Пробуем лучшую модель тут

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4922🥰7🦄6
🌟 RL-фреймворк для обучения MoE-моделей от создателей Chatbot Arena.

Miles - фреймворк для RL-обучения от команды LMSYS ORG, ориентированный на энтерпрайз-уровень.

Если вы следите за опенсорс разработками, вы наверняка слышали о предшественнике этой системы, проекте slime. Это легкий инструмент, который используют во многих современных пайплайнов пост-трейна. На нем, кстати, запускали GLM-4.6.

Slime доказал, что легковесный дизайн работает, и Miles делает следующий шаг - масштабное обучение архитектур MoE и поддержка тяжелых промышленных нагрузок.

🟡Технические детали.

Miles предлагает то, что называют "True On-Policy". Раньше между тренировкой и инференсом часто возникало расхождение. Теперь же, благодаря инфраструктурному подходу, LMSYS добилась нулевой дивергенции. Это стало возможным благодаря использованию Flash Attention 3, библиотеки DeepGEMM и ядер от Thinking Machines Lab, работающих в связке с torch.compile.

Вторая особенность - в использовании спекулятивного декодирования. Обычно в RL черновая модель замораживается, что мешает ей следовать политике целевой модели. LMSYS добавили онлайн-обучение черновой модели.

Результаты на тестах положительные: ускорение генерации более чем на 25%, особенно на поздних стадиях обучения.

🟡Стабильность.

Для энтерпрайза память - это деньги. В Miles включили механизмы, предотвращающие падение системы при некритичных ошибках OOM и исправили чрезмерное потребление памяти в FSDP.

В дорожной карте проекта обещают поддержку мультимодального обучения, совместимость со SGLang v2 и расширенное спекулятивное декодирование.


🟡Статья
🖥Github


@ai_machinelearning_big_data

#AI #ML #RL #Miles #LMSYS
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍93❤‍🔥1211🔥9🦄4💋1💘1
🌟 LLM Council: на ваши запросы отвечает совет из языковых моделей.

Андрей Карпаты опять выходит на связь опубликовал очередной vibecode проект.

Его идея в том, что вместо того, чтобы задавать вопрос одной LLM, вы можете объединить их в «Совет моделей».

LLM Council - это простое локальное веб-приложение, с интерфейсом как у ChatGPT, но с той разницей, что запрос отправляется через Openrouter нескольким LLM. Полученные ответы перекрестно оцениваются и ранжируются, и, наконец, «модель-председатель совета» формирует окончательный ответ.

Более подробно процесс выглядит так:

🟢Этап 1: Сбор мнений. 
Запрос отправляется всем моделям по отдельности, и их ответы собираются. Ответы каждой модели отображаются в отдельной вкладке, чтобы можно было их посмотреть вручную.

🟢Этап 2: Рецензирование. 
Каждая модель получает ответы других моделей. При этом идентификаторы анонимизированы, чтобы исключить «игру в любимчиков» при оценке чужих результатов. На этом этапе ответы ранжируются их по точности и глубине анализа.

🟢Этап 3: Итоговый ответ. 
Модель-председатель принимает все ответы моделей и компилирует их в единый окончательный ответ.


⚠️ Для использования нужен API-ключ OpenRouter. На платформе есть бесплатные модели


🖥Github


@ai_machinelearning_big_data

#AI #ML #LLMCouncil #Github
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
69🔥33👍27🤣18🦄6🤨1
🚀 Яков и Партнёры вместе с Yandex B2B Tech выпустили отчёт о применении облачных технологий в бизнесе.

▶️ Облако реально увеличивает прибыль: почти половина компаний отмечает эффект свыше 3% EBITDA, а в цифровых отраслях — более 5%.

▶️ Расходы на облако растут: у половины организаций они уже превышают 5% ИТ-бюджета, а более 30% планируют их увеличить.

▶️ Российский рынок облаков пока умерен по инвестициям в сравнении с мировыми игроками, поэтому потенциал роста огромен.

▶️ Главный критерий выбора провайдера — качество технологий и сервисов, а не цена. Это признак зрелого рынка.

▶️ Гибридная модель становится стандартом: свыше 70% компаний используют одновременно public cloud и on-premises, PaaS и SaaS проникли к 65–66%.

▶️PaaS — главный драйвер внедрения ИИ. Компании с развитым облаком быстрее запускают AI-проекты благодаря масштабируемым ресурсам.

Облако — критическая база для цифровой трансформации и ИИ. Бизнес всё осознаннее выбирает провайдера, рассматривая облако как фундамент стратегических технологий.
Please open Telegram to view this post
VIEW IN TELEGRAM
22🤣10👍9🔥5🤬42
✔️ OpenAI входит в сложный период, а Google стремительно усиливается

The Information опубликовала внутреннее письмо Сэма Альтмана, и его тон сильно отличается от привычного оптимизма OpenAI.

CEO прямо предупреждает команду: впереди могут быть серьёзные вызовы.

1. Google сделал резкий рывок
Альтман признаёт, что Google заметно ускорился в области ИИ.
Теперь OpenAI - не компания с комфортным отрывом от конкурентов, а участник гонки, которому снова нужно догонять.

2. Рост OpenAI может существенно замедлиться
По данным источников, к 2026 году рост выручки может уменьшится в разы.

Для компании, которая только что росла взрывными темпами, это серьёзный сигнал.

3. Внутри OPENAI ощущается напряжение
Атмосферу описывают как *«rough vibes»*: меньше уверенности в своих силах, больше осторожности.

Команда впервые за долгое время чувствует давление и неопределённость.

Фаза бурного роста заканчивается, начинается период конкуренции и стратегической выносливости.
OpenAI остаётся сильнейшим игроком, но теперь марафон важнее спринта.

https://www.theinformation.com/articles/openai-ceo-braces-possible-economic-headwinds-catching-resurgent-google

@ai_machinelearning_big_data

#AI #OpenAI #Google #TechNews
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7022🤣17🔥7🗿6😁2🦄2😢1
👑 Gemini 3 Pro теперь лидирует в IQ-тестах, набрав внушительные 130 баллов, опережая все прочие LLM!

По шкале IQ такой результат помещает её в число примерно 2% людей с наивысшим интеллектом среди всех, кто когда-либо проходил подобные тесты.

А в тесте норвежского отделения Mensa модель показала эквивалент 142 баллов IQ, что соответствует уровню лишь 0,3% самых интеллектуальных людей на планете.

@ai_machinelearning_big_data

#Gemini #google
75🔥37👍19😁10🗿7🦄4
⚡️ МТС провела шоу-финал всероссийского ИТ-чемпионата в гибридной реальности.

Более 14 тысяч участников – школьники, студенты и опытные айтишники - боролись за звание лучших в алгоритмическом и робототехническом программировании True Tech Champ, но в финал в Москве выбились только 350 из них.

Заключительный этап прошел в формате шоу-битвы роботов в гибридной реальности:
🟡сложные лабиринты с необычными поверхностями;
🟡парящие платформы;
🟡4 тысячи зрителей в зале;
🟡почти миллион онлайн-наблюдателей.

Первое место и 1 млн рублей в первом треке забрал Максим Гороховский из Москвы. Во втором треке победу одержала команда «Зато по ГОСТу» - 4 млн рублей разделили Андрей и Михаил Семенищевы. Общий призовой фонд составил 10 млн рублей.


📎 Интересный факт: по мировой статистике, 80% победителей подобных олимпиад сегодня работают в крупнейших технологических компаниях или создали собственные бизнесы стоимостью более 100 млн долларов.

«Турниры развивают умение работать под давлением, дисциплину и креативность, а также становятся площадкой для ИТ-комьюнити, где единомышленники общаются и обмениваются опытом. Такой нетворкинг может стать основой для создания перспективных технологических проектов», - прокомментировал генеральный директор МТС Web Services Павел Воронин.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
35😁18👍10🔥6👌5🦄3🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
📡 Amazon Leo: новый конкурент Starlink

Amazon представил первый рабочий образец своей новой спутниковой антенны - Amazon Leo Ultra - и открыл *ограниченный доступ* для корпоративных клиентов.

— до 1 Гбит/с на скачивание
— до 400 Мбит/с на загрузку
— работает на собственном чипе Leo Silicon

Проект Kuiper теперь называется Amazon Leo. Компания строит сеть из 3000+ спутников на низкой орбите для быстрого широкополосного интернета.

Антенна использует **фазированную решётку** - она электронно направляет луч и отслеживает спутники без моторов, сохраняя связь даже при вибрациях и дожде.

Но Amazon сильно отстаёт от Starlink:
— Starlink уже имеет 9000+ спутников,
— у Amazon — менее 200, хотя запуски продолжаются.

Важно: высокая скорость на бумаге работает только при плотной сети, хорошем спектре и мощной наземной инфраструктуре.

Amazon делает серьёзный шаг, но догнать Starlink будет очень сложно.

https://www.aboutamazon.com/news/amazon-leo/amazon-leo-satellite-internet-ultra-pro

@ai_machinelearning_big_data


#AmazonLeo #ProjectKuiper #SatelliteInternet #LEO #Amazon
👍6916🔥11😨6🤬2🤓1
⚡️ Claude Opus 4.5.

Anthropic выпустила Claude Opus 4.5, которую назвала «лучшей в мире».

Модель по тестам выбивает топовые результаты в программировании и работе с агентами. Говорят, что она даже превзошла всех кандидатов-людей на внутреннем тесте.

Модель подешевела. Цена за 1 млн. токенов теперь составляет $5 на вход и $25 на выход.

Для разработчиков добавили новый параметр (low, high и medium), позволяющий балансировать между скоростью ответа и качеством генерации.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
58🔥32👍21🥰7🤣6🤔3🤬3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Исәнмесез! Встречайте новый VK JT Meetup: ML + Java!

4 декабря VK приглашает ML-инженеров и Java-разработчиков Казани на офлайн-встречу.

В программе:
— Практические доклады от экспертов VK: управление облаком One-cloud, запуск генеративного поиска в мессенджере и выкатка RAG в прод
— Два потока на выбор: нетворкинг с настольными играми или решение реальных кейсов от VK с призами

Общайтесь с экспертами, находите лучшие решения и оставайтесь на афтепати: фуршет, нетворкинг, настолки и свободное общение.

Только офлайн, в Big Twin Arena.
🎟 Участие бесплатное, регистрация на сайте.
👍26🥱1211🤗6🤣4🥰3
Media is too big
VIEW IN TELEGRAM
✔️ Модель P1 взяла золото на Международной олимпиаде по физике.

Shanghai AI Lab натренировал семейство моделей P1 для решения сложнейших физических задач. Флагманская модель P1-235B-A22B добилась исторического результата, став первой открытой моделью, которая решила задачи Международной олимпиады по физике 2025 года на уровень золотой медали.

P1 сравнялась на физическом бенче HiPhO по количеству медалей с Gemini-2.5-Pro и обошла GPT-5. Основой успеха стала мультиагентная система PhysicsMinions, которая итеративно проверяет и улучшает решения, анализируя их логику и физическую состоятельность.

Весь проект P1, включая сами модели и бенчмарки, опубликован в открытом доступе.
prime-rl.github.io

✔️ Google готовит тысячекратное увеличение ИИ-мощностей.

Техногигант планирует в 1000 раз нарастить свои вычислительные мощности для ИИ в течение следующих 4-5 лет. По словам топ-менеджеров, Google уже вынуждена удваивать серверные емкости для ИИ каждые полгода, чтобы справляться с растущей нагрузкой.

Руководство Google считает, что риск недоинвестирования в инфраструктуру сейчас выше, чем риск перерасхода средств. План расширения опирается на три элемента: более тесную интеграцию аппаратного и программного обеспечения, повышение эффективности моделей и использование кастомных чипов.
cnbc.com

✔️ В NotebookLM добавили возможность создавать презентации и инфографику.

Сервис расширили функцией генерации слайдов на основе загруженных источников. Инструмент подойдет для быстрого структурирования информации и создания черновиков презентаций или визуально улучшения уже существующих материалов.

Слайды доступны для скачивания в формате PDF, экспорт в Google Slides и PowerPoint уже находится в разработке. За работу новой функции отвечает Nano Bana Pro.

Лимиты на использование зависят от типа аккаунта пользователя.
NotebookLM в сети Х

✔️ Reality Labs Марка Цукерберга анонсировала text-to-world систему.

WorldGen — система генерации полностью интерактивных 3D-мирой на основе простых текстовых запросов. Технология использует процедурную логику и диффузионные модели для создания детализированных и стилистически выдержанных локаций размером до 50x50 метров.

Итоговые сцены WorldGen, согласно демо-роликам, не просто статичны, а готовы к навигации и взаимодействию. Созданные миры совместимы с игровыми движками Unity и Unreal и не требуют дополнительных конвертаций или сложной настройки рендеринга.

Проект находится на стадии исследования и пока недоступен для широкого использования.
roadtovr.com

✔️ Ubisoft создает ИИ-NPC для игр.

Игровая студия анонсировала экспериментальный проект Teammates, который меняет взаимодействие с неигровыми персонажами. Технология на базе генеративного ИИ позволяет NPC понимать естественную речь и действовать как участники процесса, а не просто скриптовые боты.

В рамках прототипа, созданного на основе шутера от первого лица, игроку помогают два ИИ-напарника и голосовой ассистент Джаспар. Они способны реагировать на голосовые команды: подсвечивать цели, предоставлять информацию о сюжете, изменять игровые настройки или ставить игру на паузу. Система анализирует контекст и действия игрока, обеспечивая динамическую реакцию персонажей в реальном времени.

Ubisoft говорит, что проект уже прошел закрытое тестирование. По мнению CEO компании, ИИ станет для индустрии революцией, сравнимой с переходом игр от 2D к 3D.
news.ubisoft.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
41👍19🔥16🦄2
2025/12/03 17:37:56
Back to Top
HTML Embed Code: