Telegram Group Search
Hugging Face радуют релизами даже в празники: они выпустили большой качественный датасет по математике FineMath

Его составляли примерно также, как делали это DeepSeek для своей модели DeepSeekMath (а она очень, очень крута, подробный ее разбор тут). То есть брали CommonCrawl, обучали классификатор на аннотациях LLama-3.1-70B-Instruct и фильтровали математический контент.

В итоге получился очень приличный скейлинг. Посмотрите на график наверху: с ростом количества токенов для обучения точность модели растет заметно приятнее, чем на известных датасетах OpenWebMath и InfiMM. Это как раз за счет разнообразия и качества данных.

P.S. Какие-то любители уже даже обучили на FineMath собственного репетитора по математике (проект)
OpenAI собирается создать собственного робота-гуманоида

Об этом сообщает The Information. Весь год компания занималась робототехникой теневым образом: они пересобирали команду робо-ресерча (вакансия), которая была расформирована четыре года назад, а также инвестировали в Figure и Physical Intelligence.

Сейчас, по данным двух инсайдеров, стартап переходит в более активную фазу и уже серьезно обсуждает и изучает возможность создания собственного робота-гуманоида.

Лицо Маска представили?
Просвещаем родственников правильно
Сэм Альтман, тем временем, снова запостил в Твиттер свой традиционный новогодний вопрос "что бы вы хотели, чтобы OpenAI cделала/исправила в 2025?"

Топ-10 самых популярных ответов:

🔵 AGI (Альтман отвечает "ок" и "🫡")
🔵 Агенты
🔵 Более длинный контекст
🔵 Улучшение качества SORA и новый Dall-E (судя по ответам Сэма новая версия SORA не за горами, а вот с text2image все неоднозначно)
🔵 Улучшение Advanced Voice Mode, учет прошлых разговоров, активация войс мода без нажатия на кнопку
🔵 Family подписка и новые гибкие тарифы
🔵 Меньше ограничений и цензуры
🔵 Снижение цен на API, новый качественный RAG
🔵 Более частные обновления моделей, новая не-thinking модель
🔵 Ускорение и удушевление моделей

Писать в 2025 письмо с пожеланиями Деду Морозу
Писать Сэму Альтману
Please open Telegram to view this post
VIEW IN TELEGRAM
"Да, мам, только она у меня со странностями и постоянно повторяет, что она какая-то языковая модель, не обращай внимания"
DeepSeek опенсорснули свою новую модель V3 Chat

685 B (MoE), fp8. Бенчмарки, как и всегда у этих ребят, очень достойные. На LiveBench это теперь лучшая открытая модель, и вторая по качеству после gemini-exp-1206 среди не-ризонеров. На Aider обгоняет Sonnet, уступая только o1.

Вообще, желаем всем такой продуктивности, как у DeepSeek. Только за последний месяц они выпустили DeepSeek 2.5, поиск, DeepSeek VL2, DeepSeek-R1, и вот теперь v3.

Чекпоинт уже доступен на Hugging Face
Центральный Университет – да или нет: отзыв магистра изнутри
В этом году у всех на слуху этот вуз: применяют STEM-подход в обучении, возвращают ученых с мировым именем, чтобы развивать ИИ в стране, одерживают громкие победы в престижных международных соревнованиях и т.д.

Для тех, кто думает, куда подавать документы и на что ориентироваться при выборе вуза, нашли полезную статью. Студент публикует взгляд изнутри на учебные процессы, экспертизу преподавателей, общую атмосферу, включая оснащение аудиторий. Впечатления честные и супер подробные. Пишет, кстати, как раз ML-щик, поэтому там еще много доменных деталей (например, про ридинг-клабы) и скринов описаний DS-курсов.

Читаем полностью тут
Забавно: новая DeepSeek v3 на русском обозначает себя как модель от OpenAI. В то же время на английском она представляется нормально, как творение DeepSeek.

Русскоязычные датасеты что-то знают 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
А вот это просто забавно: игра Asteroids с лого ИИ-вендоров вместо врагов 🤣

И главное: создано это полностью с помощью DeepSeek v3 за несколько минут (репа)

Нашлось занятие на вечер
Please open Telegram to view this post
VIEW IN TELEGRAM
Как быть на стиле на Новогодней вечеринке, туториал:
Любители красивой математики, вам посвящается:

(1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9)² = 2025

1³+ 2³+ 3³+ 4³+ 5³+ 6³+ 7³+ 8³+ 9³ = 2025

(20 + 25)² = 2025

2025/ (2 + 0 + 2 + 5) = 225

А еще если сложить первые (20+25) нечетных чисел, тоже получится 2025

С Новым Годом, что-ли 🎄
Please open Telegram to view this post
VIEW IN TELEGRAM
DeepSeek v3 появилась на LMSYS арене!

И вы гляньте, какая красота: по большинству бенчмарков моделька бьет не то что Sonnet, а GPT-4o. На математике так вообще пушка.

Вот уж действительно подарок на Новый Год от Китая
Сколько. Ты. Зарабатываешь. OpenAI "изобрели" новое денежное определение для AGI 🤑

Вы же помните, что у OpenAI сможет официально разорвать сделку с Microsoft, если достигнет AGI? Это зафиксировано на бумаге. Но как в официальных документах определяется размытое понятие AGI? Об этом никто не знал, до вчерашнего дня.

Вчера The Information сообщили, что в прошлом году обе компании подписали соглашение, в котором говорится, что OpenAI достигнет AGI, когда разработает системы ИИ, которые смогут генерировать не менее 100 миллиардов долларов прибыли в год. Вот такое вот простое финансовое определние.

Кстати, тут получается некоторое расхождение. Ведь Альтман говорил, что AGI появится в 2025. А потом Альтман говорил, что у OpenAI вообще не будет прибыли до 2029. Многие пишут, что OpenAI скорее всего объявит об AGI раньше, чем будут выполнены условия о 100млрд. И хотя в таком случае договор все равно можно будет расторгнуть, Microsoft получит доступ к моделям OpenAI еще на десятилетия вперед (хорошо устроились!).
Please open Telegram to view this post
VIEW IN TELEGRAM
Эксперты рассказали, в каких направлениях будет развиваться ИИ в ближайшее время

В главных трендах — мультимодальные модели искусственного интеллекта, больше открытого кода, высоко персонализированные сервисы и развитие ИИ-агентов.

В статье приведены мнения экспертов из разных компаний. В том же Яндексе говорят про тренд на Open Source — открытые модели увеличат скорость разработки инновационных продуктов и создания более доступных технологий.
Please open Telegram to view this post
VIEW IN TELEGRAM
🚀 Итоги года в Data Secrets!

Для нашей команды 2024 выдался очень продуктивным. За это время:

➡️ Подписчиков в канале Data Secrets стало больше на 21к. Это рост почти в два раза! За год мы выложили здесь 2.6к постов, собрали на них 21.5 млн просмотров, 14к комментариев, 177к реакций, 322к репостов

➡️ Мы стали первым верифицированным ML-каналом в телеграме

➡️ Запустили свой сайт datasecrets.ru

➡️ Запустили на сайте страницу с вакансиями в ML/DS и уже опубликовали больше 300 позиций

➡️ Запустили платформу для хакатонов и помогли трем компаниям организовать соревнование

➡️ Начали вести блог на Хабр, написали там больше 20 публикаций и собрали на них более 388 тысяч просмотров

➡️ Запустили второй канал про карьеру в ML @data_secrets_career, и уже набрали в нем 4700 подписчиков

Дальше – больше!
Please open Telegram to view this post
VIEW IN TELEGRAM
Известный мировой тех.подкаст про AI Latent.Space в честь Нового Года выложили 2025 AI Engineering Reading List

Это огромный список актуальных мастридов для ML/AI инженеров. В нем нет базовой базы, а только те статьи, которые непосредственно относятся к современным развивающимся методам и технологиям.

Охвачены 10 самых важных на сегодняшний день областей: файнтюнинг, агенты, диффузия, голос, вижн модели, генерация кода, RAG, цепочки рассуждений, бенчмарки и эвал, и frontier LLMs.

Список получился у ребят действительно очень крутой и насущный, так что обязательно забирайте себе в бэклог или в ридинг-клабы.
Как ощущается сегодняшний рабочий день
2025/06/14 14:34:17
Back to Top
HTML Embed Code: