Telegram Group Search
VibeThinker-1.5B - миниатюрная модель, которая показывает SOTA-результаты в задачах рассуждения.

🚀 Производительность: одна из лучших на AIME24/25 и HMMT25 - превосходит DeepSeek R1-0120 по математическим задачам и опережает модели такого же размера в соревновательном программировании.

Эффективность: всего 1.5B параметров. то есть в 100–600 раз меньше, чем гиганты вроде Kimi K2 и DeepSeek R1.

💰 Стоимость: полный пост-тренинг обошёлся всего в $7.8K, примерно в 30–60 раз дешевле, чем у DeepSeek R1 или MiniMax-M1.

Модель основана на Spectrum-to-Signal Principle (SSP) и MGPO-фреймворке, оптимизирующих процесс рассуждения.

📦 Model: https://huggingface.co/WeiboAI/VibeThinker-1.5B
💻 GitHub: https://github.com/WeiboAI/VibeThinker
📄 Arxiv: https://arxiv.org/abs/2511.06221

@ai_machinelearning_big_data


#AI #LLM #Reasoning #OpenSource #SmallModel
46👍24🔥11😁6🤔3🗿2
🧐🎁😌👹😋😡🙊😍🤷‍♂️👹

⚡️Создание production-ready AI-агента.

AI-агенты перестали быть экспериментом — они становятся основой продуктовых решений. Вопрос лишь в том, умеете ли вы создавать своих?

С 20 ноября будет Yandex AI Studio Series — серия практических вебинаров для тех, кто хочет пройти путь от идеи до production-ready AI-агента за 7 дней.

Что будет на интенсиве:
✔️ 4 онлайн-трансляции с сессией вопросов и ответов.
✔️ Предзаписанный воркшоп для самостоятельной практики.
✔️ Квиз и приятные сюрпризы.
✔️ Нетворкинг в продуктовом комьюнити.
✔️ Офлайн-встреча в офисе Яндекса в Москве.

Все решения будем деплоить на базе Yandex AI Studio — платформы от Яндекса для разработки AI-агентов.

Участие в мероприятии бесплатное.

Если вы AI/ML-инженер или разработчик и хотите углубиться в инженеринг агентов и мультиагентных систем — присоединяйтесь. Регистрация уже идет и доступна по ссылке.

@ai_machinelearning_big_data

#ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2714😁7🤣6🗿5🦄4🥰3🥱3😐1
💰Anthropic впервые строят собственную инфраструктуру

Компания объявила о масштабных инвестициях в строительство дата-центров в Техасе и Нью-Йорке совместно с Fluidstack. Это объекты, оптимизированные под задачи Anthropic - максимально энергоэффективные и рассчитанные на развитие передовых моделей Claude.

Проект создаст около 800 постоянных рабочих мест и 2 400 рабочих на этапе строительства, запуск ожидается в течение 2026 года. Инициатива поддерживает AI Action Plan администрации США, направленный на укрепление лидерства страны в сфере искусственного интеллекта.

CEO Anthropic Дарио Амодеи отметил, что инфраструктура - ключ к следующему этапу прогресса: созданию ИИ, способного ускорять научные открытия и решать сложные задачи.

Сейчас Anthropic обслуживает более 300 000 бизнес-клиентов, а число крупных контрактов (от 100 000 $ в год) выросло почти в 7 раз за год.

Fluidstack выбрана за способность быстро вводить в эксплуатацию гига­ваттные мощности. Партнёры обещают гибкое и эффективное развертывание, обеспечивающее устойчивый рост Anthropic без перегрузки по затратам.

Anthropic закладывает фундамент для долгосрочного доминирования в сфере ИИ, делая ставку на собственную вычислительную базу в США и поддержку национальной технологической независимости.

https://www.anthropic.com/news/anthropic-invests-50-billion-in-american-ai-infrastructure

@ai_machinelearning_big_data


#Anthropic #claude
👍6122🔥8😁5
⚡️ ChatGPT-5.1

OpenAI выпустила GPT-5.1, сделав основной упор на интеллект и качество диалога.

🟢GPT-5.1 Instant - модель с функцией адаптивного мышления. Она способна самостоятельно «задумываться» над сложными задачами, что позволило выбивать более высокие баллы по математическим задачам AIME 2025 и задачам по программированию Codeforces. Модель стала лучше следовать инструкциям и получила более «теплый» стиль общения по умолчанию.

🟢GPT-5.1 Thinking тоже была улучшена: она быстрее справляется с простыми запросами и выдает более четкие ответы с меньшим количеством жаргона.

Вместе с моделями OpenAI расширила возможности кастомизации тона ответов, добавив новые стили: «Профессиональный», «Откровенный» и «Необычный».

Обновление уже раскатывают на платных подписчиков, а доступ через API появится в ближайшие дни. Предыдущие версии GPT-5 останутся доступны в течение трех месяцев.

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5527🔥12🤣6🕊3
За 2,5 часа прокачаем маркетинг с нейросетями

Технари, проходите мимо — здесь эфир для ребят из маркетинга.

25 ноября приходите на онлайн-интенсив по AI. Вас ждет:

📈 Кейс-стади. COFIX, CDEK, Звук и Gulliver расскажут, как оптимизировали маркетинг с ML и LLM. С результатами в цифрах!

Например, Cofix ускорил обработку клиентских отзывов в 7000 раз. А Gulliver удвоил CTR товарных карточек на маркетплейсах.

👨‍🏫 Воркшоп по промптингу. Эксперты в прямом эфире помогут сегментировать клиентов, персонализировать рассылки и рекламу с ChatGPT.

📅 25 ноября, 11:00–13:30 мск
💻 Онлайн, бесплатно

Зарегистрироваться

erid: 2W5zFGc9QgY
🤣1914👍5🥰3🌭2💅2👌1👀1🗿1💘1
Media is too big
VIEW IN TELEGRAM
✔️ Microsoft представила Visual Studio 2026.

По словам Microsoft - это первая в мире «интеллектуальная IDE», она запускается быстрее и на 50% реже зависает, а ее ИИ-инструменты, включая новых агентов для C# и C++, теперь помогают не только в написании кода, но и в отладке, профилировании и модернизации приложений. Новая версия получила полную совместимость с проектами и расширениями от VS 2022.

Кроме того, среда разработки была отделена от инструментов сборки, так что теперь можно обновлять саму IDE, не затрагивая компиляторы .NET и C++. Visual Studio 2026 уже доступна для подписчиков, а автономная лицензия поступит в продажу с 1 декабря 2025 года. Полный список изменений - в Release Notes.
devblogs.microsoft.com

✔️ Google объединит мощь Gemini с приватностью локальных вычислений.

Google анонсировала новую платформу Private AI Compute, которая позволяет использовать Gemini в облаке, обеспечивая при этом уровень приватности, сопоставимый с обработкой на устройстве. В основе лежит изолированное защищенное окружение на базе собственного технологического стека Google, а данные обрабатываются в специальном зашифрованном пространстве, доступ к которому имеет только пользователь.

Google обещает, что даже сотрудники компании не смогут получить доступ к информации. Первыми возможностями на базе этой платформы станет учучшатель промптов Magic Cue на Pixel 10 и обобщение транскрипций в приложении Recorder.
blog.google

✔️ LAION запустили Project AELLA для ИИ-структуризации научных статей.

LAION, совместно с Inference.net и Wyndlabs AI, представили открытую инициативу Project AELLA для демократизации доступа к научным знаниям. В рамках проекта было обработано около 100 млн. академических публикаций, для которых с помощью LLM создаются структурированные аннотации.

Проект должен значительно ускорить поиск информации, улучшить машинный анализ и повысить доступность научного контента. Специально для этой задачи были дообучены 2 языковые модели. По заявлению LAION, в целевых тестах они показывают производительность, сравнимую с GPT-5 и Claude 4.5.

На старте проект предлагает датасет из 100 тыс. готовых аннотаций, дообученные модели и 3D-визуализатор для навигации по научным областям. Все материалы открыты для исследователей и разработчиков.
laion.ai

✔️ Стартап Olares анонсировал персональное ИИ-облако с RTX 5090 Mobile.

Стартап Olares показал свой дебютный продукт - Olares One. Это персональное ИИ-облако, спроектированное для локального запуска моделей. Устройство выполнено в формате компактного десктопа, оснащено видеокартой NVIDIA GeForce RTX 5090 Mobile с 24 ГБ памяти GDDR7, процессором Intel Core Ultra 9 275HX и 96 ГБ оперативной памяти.

Работать Olares One будет под управлением собственной открытой Olares OS. Предзаказы стартуют на Kickstarter в декабре, а полноценная презентация состоится на выставке CES в январе 2026 года. Проект уже привлек $45 млн. инвестиций.
techpowerup.com

✔️ Создан протокол шифрованной самопроверки на уровне чипа для квантового компьютера.

Международная команда исследователей успешно протестировала криптографически защищенный протокол верификации, который позволяет квантовому компьютеру самостоятельно проверять корректность собственных результатов. Технология была развернута на квантовом процессоре H1-1 от Quantinuum и показала свою эффективность на задаче с 52 кубитами.

Идея заключается в интеграции проверочных тестов непосредственно в процесс вычислений на одном чипе. Протокол случайным образом чередует вычислительные раунды с тестовыми ловушками. Анализируя результаты тестов, система статистически определяет, можно ли доверять итоговому результату вычислений.
phys.org

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3523🔥10🥰2👌2
Как хакеры достигают целей и как от них защититься? ML-команда «Позитива» едет в Питер, чтобы разобрать настоящую атаку, и расскажет:

- Как найти аномалии в потоке легитимных событий;
- Почему нельзя обойтись без умного анализа трафика;
- Какие модели помогают детектировать вредоносы;
- Как помогают защищаться AI-агенты на самом деле.

Специальный гость митапа — Женя Никитин (CTO CelsusAI) расскажет, как масштабировать обучение в условиях ограниченных данных медтеха.

Без записи. Без повторов.

19 ноября, 18:00, Арт-галерея Zarenkov Gallery

Регистрация обязательна. Количество мест ограничено.
🤣14👍11🔥105🥱21
This media is not supported in your browser
VIEW IN TELEGRAM
📌 Anthropic проверила, сможет ли Claude обучить робособаку.

Anthropic провели эксперимент «Project Fetch», в котором две команды сотрудников, не имевшие опыта в робототехнике, пытались настроить четвероногого робота Boston Dynamics Spot: ему нужно было принести пляжный мяч, пройдя три этапа возрастающей сложности.

Одна команда работала с Claude, вторая - без него.

Группа с Claude справилась вдвое быстрее, выполнив больше задач и в целом, участники с ИИ чувствовали себя увереннее.

Они навайбкодили больше строк, успели поэкспериментировать с управлением на естественном языке и дважды накосячить: неправильно рассчитали скорость движения робота и немного затупили с алгоритмом распознавания мяча.

Команда без доступа к ИИ испытывала тряску выражала больше негативных эмоций и замешательства, им приходилось чаще консультировались друг с другом.

Проект Fetch - это первый шаг Anthropic в оценке того, как использование моделей может влиять на реальные R&D, и он лишь подтвердил необходимость в человеческом надзоре, хотя, по итогу оказался эффективней традиционного RL.

🔜 Полный отчет и видео-документалка на сайте Anthropic.

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4825🔥10🥰2
LLM теперь и в гуманитарке


Яндекс вместе с Институтом востоковедения РАН сделали ИИ-помощника, который переваривает научные тексты на восточных языках и выдает аналитические выжимки.


Под капотом — генеративные модели Yandex Cloud, обученные совместно со студентами ШАД. Архитектура — на Yandex AI Studio, где строят и деплоят ИИ-агентов.


База уже 1,5+ млн документов на четырёх вариантах китайского языка. Ассистент умеет доставать факты, делать дайджесты и переводить всё это на русский.


Фишка — скорость: анализ, который раньше занимал часы, теперь укладывается в 10–15 минут.
Отличный кейс того, как LLM заходят в академическую среду и реально ускоряют ресерч.

https://nauka.tass.ru/nauka/25599877
😁21👍15😴9🔥6🕊53🥱3🥰2
⚡️ Baidu релизнула ERNIE 5.0.

Китайский техгигант выпустил новую версию своей флагманской языковой модели Ernie 5.0 на 2.4 трлн. параметров.

Модель омнимодальна, т.е может работать с текстом, изображениями, аудио и видео как на входе, так и на выходе.

В ERNIE 5.0 улучшили понимание инструкций, креативное письмо и она показывает сильные результаты в задачах, требующих логики, запоминания и убедительности.

Пока кроме этих общих формулировок и трудночитаемых картинок с бенчмарками подробной информации нет, но модель можно потестить в чат-боте.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
34👍12🔥8😁1
🤖Организаторы Международной олимпиады по промышленной разработке PROD отправили в ведущие школы России роботов, чтобы пригласить старшеклассников принять участие в мировом соревновании.

Роботы общаются, обнимаются, ходят по классам и говорят, что для участия в PROD хватит школьной программы по информатике. Железных ребят можно понять, они как никто заинтересованы в новом поколении айтишников, которые будут обучать их в будущем, о чем и заявили школьникам: «Зарегистрируйся на PROD, чтобы научить меня делать это»

Регистрация на олимпиаду открыта до 2 декабря, участие доступно всем школьникам, интересующимся промышленными технологиями и разработкой.

@ai_machinelearning_big_data

#news
👍3510🥰9😁6🔥4
Media is too big
VIEW IN TELEGRAM
🌟 World Labs открыла публичный доступ к Marble.

Стартап сделал общедоступной свою генеративную мультимодальную «модель мира» Marble, анонсированную 2 месяца назад.

На платформе, где развернута модель, можно создавать детализированные 3D-сцены из текста, одного или нескольких изображений, коротких видео и простых 3D-макетов.

Фишкой сервиса стал инструмент Chisel, который позволяет «лепить» миры, отделяя структуру от стиля. Пользователь может задать геометрию сцены с помощью примитивных 3D-фигур, а ее визуальное наполнение и стилистику описать текстовым промптом.

Marble поддерживает интерактивное редактирование, бесшовное расширение уже сгенерированных пространств и создание композиции из нескольких миров.

Готовые сцены можно экспортировать в форматы Gaussian splats, полигональные сетки или видео.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71🔥2410🌭4🌚2❤‍🔥1
Media is too big
VIEW IN TELEGRAM
✔️ Эффективность локального ИИ выросла в 5.3 раза за два года.

Группа Hazy Research провела исследование, доказывающее рост жизнеспособности локального ИИ-инференса. Для оценки взяли унифицированный показатель «интеллект на ватт» (intelligence per watt, IPW) - это соотношение точности выполнения задачи к потребляемой мощности.

Результаты показали, что локальные LLM до 20 млрд. параметров уже способны обрабатывать 88.7% типичных одноэтапных запросов в чатах и задачах на логику. Общая эффективность локального ИИ показала рост в 5.3 раза за период с 2023 по 2025 год. Этот скачок обусловлен как улучшением самих моделей (в 3.1 раза), так и развитием аппаратных ускорителей (в 1.7 раза).
stanford.edu

✔️ LeJEPA: self-supervised learning без сложных эвристик.

Ян Лекун предложил простой метод ля self-supervised обучения - LeJEPA. Традиционные подходы требовали сложных трюков чтобы избежать коллапса признаков: stop-gradient и сетей учитель-студент. LeJEPA отказывается от этих эвристик в пользу одного регуляризатора, SIGReg (Sketched Isotropic Gaussian Regularization).

Задача SIGReg - заставить векторы признаков равномерно распределяться в пространстве, формируя изотропное сферическое облако. В своей работе, Ян доказывает, что такая форма математически оптимальна для минимизации ошибок на будущих задачах.

На практике это делает обучение более стабильным, упрощает его масштабирование и оценку качества модели. Тестовая модель на 1.8 млрд. параметров и показала 79% точности на ImageNet-1K. Код LeJEPA доступен на GitHub.
arxiv.org

✔️ Lumine от ByteDance: ИИ-агент, способный часами проходить 3D-игры.

ByteDance разработал ИИ-агента, который может самостоятельно выполнять многочасовые миссии в сложных открытых 3D-мирах, например в Genshin Impact, Honkai: Star Rail и Wuthering Waves. В отличие от своих конкурентов, Lumine обрабатывает видеопоток с экрана и генерирует команды для клавиатуры и мыши в реальном времени.

Агент построен на базе Qwen2-VL-7B и обучен на 1700 часах человеческого геймплея. Сначала он осваивал базовые действия, а затем учился следовать инструкциям и, наконец, развил способность к адаптивному мышлению на небольшом ризонинг-датасете.

В тестах Lumine показал способности сражаться с боссами, используя тактику, решать головоломки и взаимодействовать с NPC. Что важно, агент может переносить навыки, справляясь с задачами в незнакомых локациях и в совершенно новых играх без дополнительного обучения.
lumine-ai.org

✔️ IBM представила квантовые процессоры Nighthawk и Loon.

IBM анонсировала 2 новых квантовых процессора и объявила о переносе всего производства на 300-мм пластины на мощностях Albany NanoTech. Этот переход позволяет снизить стоимость чипов и, по заявлению компании, уже удвоил скорость НИОКР.

Nighthawk на 30% увеличивает сложность схем при прежнем уровне ошибок и ориентирован на задачи с 5000 двухкубитных гейтов. Он станет доступен пользователям IBM к концу 2025 года. Чип Loon, в свою очередь, сфокусирован на отказоустойчивости, он использует эффективные коды коррекции ошибок (qLDPC), реализованные на год раньше, чем планировалось.

Опираясь на эти инновации, IBM подтвердила свои планы по достижению квантового превосходства к 2026 году и созданию полноценной отказоустойчивой системы к 2029.
ibm.com

✔️ Chad IDE: среда разработки со встроенными TikTok и Tinder.

Стартап Clad Labs, выпустился из Y Combinator с продуктом «Chad: The Brainrot IDE». Это среда разработки со встроенными развлечениями. Идея в том, что пока разработчик ждет завершения задачи от ИИ-ассистента, он может полистать TikTok, Tinder или поиграть в мини-игры прямо в окне IDE.

По мнению основателей, это решает проблему «переключения контекста». Вместо того чтобы брать в руки телефон и полностью выпадать из рабочего процесса, разработчик остается в среде разработки и может мгновенно вернуться к коду, как только ИИ закончит свою работу.

Сейчас Chad IDE находится в стадии закрытого бета-тестирования, доступ можно получить только по приглашению.
techcrunch.com

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4911🔥9😁6🥰5🎅3🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
Ноябрь — месяц One Day Offer в GigaChat и Kandinsky 📆

В ноябре команды двух топовых IT-продуктов Сбера планируют обрести новых классных коллег — DL Engineers и Researchers, чтобы вместе работать над GigaChat и Kandinsky: развивать, обучать и дообучать модели.

Смотрите расписание One Day Offer и не упустите шанс присоединиться к крупнейшему AI-комьюнити. Целых восемь мероприятий, чтобы изменить свою карьеру и жизнь — выбирайте то, что подходит под навыки и цели, и регистрируйтесь!
12👍7😁5🤔4🔥2🥰2🤣1
🚀 Qwen выпустила DeepResearch 2511 - обновление глубокого исследования.

Основные изменения:
Добавлены два режима работы д
- Normal - быстрый и универсальный
- Advanced - тратит больше времени на анализ, чтобы дать максимально глубокий разбор

📄 Поддержка загрузки файлов
Теперь можно отправлять документы и изображения прямо в модель для анализа.

Улучшенный поиск
Обновлённый механизм быстрее считывает и обрабатывает веб-информацию, углубляя результаты исследования.

📊 Точный контроль отчётов
Можно задавать структуру отчёта: объём, количество абзацев, формат и детализацию. Улучшена надёжность цитирования.

🧑‍💻 Новый UX
Переработанная архитектура делает интерфейс заметно быстрее и отзывчивее.

🔗 Web: https://chat.qwen.ai/?inputFeature=deep_research
📱 App: https://qwen.ai/download

@ai_machinelearning_big_data

#qwen
👍3618🔥12👏2
Константин Воронцов стал лауреатом Yandex ML Prize 2025

Каждый год Яндекс вручает награды за вклад в развитие машинного обучения. С этого года премия проводится при экспертной поддержке Школы анализа данных и вручается преподавателям и руководителям образовательных программ по искусственному интеллекту.

Особенно рады за Константина Воронцова, профессора РАН и заведующего кафедрами машинного обучения в МГУ и МФТИ –– он получил специальную награду «Зал славы». Он внёс значительный вклад в развитие образования в сфере ML в России и стал одним из создателей MachineLearning.ru — ресурса, на котором выросло целое поколение. Кроме него премию Yandex ML Prize 2025 получили 12 человек, всего было подано 300 заявок.
👍59🔥2710👏4😁3🥰2🤓2
Media is too big
VIEW IN TELEGRAM
UBTech заявила о первой в мире массовой поставке гуманоидных роботов.

Китайская компания из Шэньчжэня уже получила заказы на более чем 800 млн юаней (112 млн долларов) на своего робота Walker S2. Среди них - контракт на 159 млн юаней для проекта по сбору данных в городе Цзыгун и ещё один, на 250 млн юаней, о котором сообщили в сентябре от крупной китайской компании.

Гуманоиды переходят из демонстраций в реальные промышленные поставки - и это серьёзный сигнал для всей отрасли робототехники.

@ai_machinelearning_big_data

#robots #ai
👍31🔥19🥰75👏3🌚3❤‍🔥2
2025/11/15 03:33:47
Back to Top
HTML Embed Code: