Вау: MLE-STAR от Google
Google представила MLE-STAR — это новый инженерный агент для машинного обучения, который объединяет веб-поиск и целенаправленное улучшение блоков кода. В отличие от аналогов, MLE-STAR решает задачи ML следующим образом:
Сначала агент ищет в интернете подходящие модели для решения задачи —> затем он тщательно тестирует, какие части кода наиболее важны, и оптимизирует их. При этом MLE-STAR использует новый ансамблевый метод.
Модель одержала победу в 63% конкурсов Kaggle в рамках MLE-Bench-Lite.
Блог | Статья
Google представила MLE-STAR — это новый инженерный агент для машинного обучения, который объединяет веб-поиск и целенаправленное улучшение блоков кода. В отличие от аналогов, MLE-STAR решает задачи ML следующим образом:
Сначала агент ищет в интернете подходящие модели для решения задачи —> затем он тщательно тестирует, какие части кода наиболее важны, и оптимизирует их. При этом MLE-STAR использует новый ансамблевый метод.
Модель одержала победу в 63% конкурсов Kaggle в рамках MLE-Bench-Lite.
Блог | Статья
❤28
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤57
Подборка открытых вакансий 🔵
Junior AI Researcher в ИТМО
От 70.000 до 100.000₽
Офис в Санкт-Петербурге
Middle ML Engineer в СовкомБанк
Офис в Санкт-Петербурге
Middle Data Scientis в Ozon
Офис
Middle/Senior ML-разработчик в VK Team
Офис / Гибрид в Москве
Middle/Senior ML-инженер в Т-Банк
Офис / Гибрид
Senior Data Scientist в Сбер
Офис в Москве
Senior Data Analyst в Wildberries
Офис / Гибрид в Москве
Junior AI Researcher в ИТМО
От 70.000 до 100.000₽
Офис в Санкт-Петербурге
Middle ML Engineer в СовкомБанк
Офис в Санкт-Петербурге
Middle Data Scientis в Ozon
Офис
Middle/Senior ML-разработчик в VK Team
Офис / Гибрид в Москве
Middle/Senior ML-инженер в Т-Банк
Офис / Гибрид
Senior Data Scientist в Сбер
Офис в Москве
Senior Data Analyst в Wildberries
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Небольшие советы от Александра Ван:
➖ «Окружите себя по-настоящему замечательными людьми. Войдите в топ 1% по какому-то направлению.
➖ Найдите то, над чем можно работать долгое время (10+ лет). Скакать с места на место не приведет вас к мастерству.
➖ Работайте усерднее, чем можете. Упорный труд — это привычка, которую лучше всего усваивать в молодости.»
Please open Telegram to view this post
VIEW IN TELEGRAM
❤43
Data Scientist в Авито
Удаленно / Гибрид / Офис в Москве
Предстоит: улучшать алгоритмы поиска фрода и спама в сервисе, который обрабатывает тысячи событий в минуту; искать нетривиальные и эффективные решения реальных бизнес-задач; постоянно улучшать средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде.…. Узнать подробнее🔵
Удаленно / Гибрид / Офис в Москве
Предстоит: улучшать алгоритмы поиска фрода и спама в сервисе, который обрабатывает тысячи событий в минуту; искать нетривиальные и эффективные решения реальных бизнес-задач; постоянно улучшать средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде.…. Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Наткнулись на занимательную статистику:
➡️ Сейчас выпускники вузов составляют всего 7% от общего числа нанятых сотрудников в технологических компаниях. При этом число новых сотрудников сократилось на 25% по сравнению с 2023 годом и более чем на 50% по сравнению с допандемическим уровнем 2019 года.
➡️ В стартапах ситуация похожая: выпускники вузов составляют менее 6% от общего числа нанятых сотрудников. Число новых сотрудников упало на 11% по сравнению с 2023 годом и более чем на 30% по сравнению с 2019 годом.
➡️ В ходе исследования ребята из SignalFileвыяснили, что 80% сотрудников, нанятых Anthropic как минимум два года назад, оставались в компании к концу второго года — это очень высоки показатель для отрасли с высокой текучестью кадров. DeepMind идёт следом с 78%, а OpenAI отстаёт с 67%, но остаётся на уровне крупных компаний FAANG, таких как Meta (64%).
➡️ Для более ясного понимания: вероятность ухода инженеров из OpenAI в Anthropic в 8 раз выше, чем наоборот. В DeepMind соотношение почти 11:1 в пользу Anthropic. Вот вам и гонка за талантами.
Полный отчет
Полный отчет
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Магнит.Tech в поисках сотрудников на следующие позиции:
➡️ Data Engineer
Удаленно / Офис / Гибрид
➡️ Data Analyst
Удаленно / Офис / Гибрид в Москве, Краснодаре
➡️ DWH разработчик
Удаленно / Офис / Гибрид в Москве, Краснодаре, Иннополисе
Компания предлагает работу на следующих условиях:
- Скидки для сотрудников от PrimeZone;
- ДМС со стоматологией;
- Оформление в аккредитованную IT-компанию;
- Возможность реализовать свой опыт и потенциал в масштабных проектах;
И многое другое!
Удаленно / Офис / Гибрид
Удаленно / Офис / Гибрид в Москве, Краснодаре
Удаленно / Офис / Гибрид в Москве, Краснодаре, Иннополисе
Компания предлагает работу на следующих условиях:
- Скидки для сотрудников от PrimeZone;
- ДМС со стоматологией;
- Оформление в аккредитованную IT-компанию;
- Возможность реализовать свой опыт и потенциал в масштабных проектах;
И многое другое!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Аналитик-разработчик в Магнит Tech
Удаленно / Гибрид / Офис в Москве, Краснодаре, Санкт-Петербурге, Иннополисе
Предстоит: реализовывать алгоритмы ценообразования; разрабатывать дашборды для ценообразования; предлагать эффективные методы по улучшению текущих способов ценообразования…. Узнать подробнее🔵
Удаленно / Гибрид / Офис в Москве, Краснодаре, Санкт-Петербурге, Иннополисе
Предстоит: реализовывать алгоритмы ценообразования; разрабатывать дашборды для ценообразования; предлагать эффективные методы по улучшению текущих способов ценообразования…. Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Team Lead E-com в Магнит Tech
Гибрид / Офис в Москве, Краснодаре
Предстоит: Разрабатывать и сопровождать модели ценообразования (базовые цены, динамика, персонализация); Анализировать эластичность, кросс-эффектов, промо-эффективности и каннибализации…. Узнать подробнее🔵
Гибрид / Офис в Москве, Краснодаре
Предстоит: Разрабатывать и сопровождать модели ценообразования (базовые цены, динамика, персонализация); Анализировать эластичность, кросс-эффектов, промо-эффективности и каннибализации…. Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Собрали небольшую подборку статей в области компьютерного зрения:
🔷 PooDLe: Pooled and dense self-supervised learning from naturalistic videos
Авторы предлагают новый метод самообучения на видеоданных, где много объектов разного размера и сложный фон. PooDLe объединяет два подхода: анализ общей сцены и детальное отслеживание движения объектов. Проверка на наборах данных BDD100K и Walking Tours подтвердила эффективность метода.
🔷 MatAnyone: Stable Video Matting with Consistent Memory Propagation
Этот метод улучшает выделение объектов в видео, особенно на сложном фоне. Вместо того чтобы обрабатывать каждый кадр отдельно, MatAnyone учитывает информацию из предыдущих кадрах, сохраняя четкость границ и стабильность результата. Для обучения использовали новый большой датасет.
🔷 Magma: A Foundation Model for Multimodal AI Agents
Magma — универсальная модель, которая понимает не только текст и изображения, но и может выполнять действия, например, управлять интерфейсами или роботами, то есть Magma может решать различные мультимодальные агентские задачи. Её обучали на разнообрахных данных, включая видео и робототехнику, что позволило добиться высокой адаптивности.
🔷 RelationField: Relate Anything in Radiance Fields
Исследователи расширили возможности Neural Radiance fields, научив их анализировать не только отдельные объекты, но и связи между ними. Это открывает новые возможности, например, создание 3D-сцен с семантическими отношениями между объектами.
🔷 Layered Image Vectorization via Semantic Simplification
Новый способ преобразования растровых изображений в векторные. Сначала изображение упрощается до основных семантических элементов, затем добавляются детали. В результате получаются слоистые векторные изображения, которые легко редактировать и которые сохраняют важные детали.
Авторы предлагают новый метод самообучения на видеоданных, где много объектов разного размера и сложный фон. PooDLe объединяет два подхода: анализ общей сцены и детальное отслеживание движения объектов. Проверка на наборах данных BDD100K и Walking Tours подтвердила эффективность метода.
Этот метод улучшает выделение объектов в видео, особенно на сложном фоне. Вместо того чтобы обрабатывать каждый кадр отдельно, MatAnyone учитывает информацию из предыдущих кадрах, сохраняя четкость границ и стабильность результата. Для обучения использовали новый большой датасет.
Magma — универсальная модель, которая понимает не только текст и изображения, но и может выполнять действия, например, управлять интерфейсами или роботами, то есть Magma может решать различные мультимодальные агентские задачи. Её обучали на разнообрахных данных, включая видео и робототехнику, что позволило добиться высокой адаптивности.
Исследователи расширили возможности Neural Radiance fields, научив их анализировать не только отдельные объекты, но и связи между ними. Это открывает новые возможности, например, создание 3D-сцен с семантическими отношениями между объектами.
Новый способ преобразования растровых изображений в векторные. Сначала изображение упрощается до основных семантических элементов, затем добавляются детали. В результате получаются слоистые векторные изображения, которые легко редактировать и которые сохраняют важные детали.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
Подборка открытых вакансий 🔵
Стажер Data scientist/Data analyst в Сбер
Офис в Москве
Senior NLP Engineer в Магнит Tech
Удаленно / Гибрид / Офисы в Москве, Краснодаре, Иннополисе
Middle CV Engineer в Wildberries
Офис / Гибрид в Москве
Senior Data Scientist в VK Team
Офис / Гибрид в Москве
Senior MLOps в Магнит Tech
Удаленно / Гибрид / Офисы в Москве, Краснодаре
Senior Data Analyst в X5 Tech
Стажер Data scientist/Data analyst в Сбер
Офис в Москве
Senior NLP Engineer в Магнит Tech
Удаленно / Гибрид / Офисы в Москве, Краснодаре, Иннополисе
Middle CV Engineer в Wildberries
Офис / Гибрид в Москве
Senior Data Scientist в VK Team
Офис / Гибрид в Москве
Senior MLOps в Магнит Tech
Удаленно / Гибрид / Офисы в Москве, Краснодаре
Senior Data Analyst в X5 Tech
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Forbes: свежий рейтинг российских вузов по уровню подготовки ИИ-специалистов
В рейтинг вошли 203 российских университета, реализующих программы специалитета и бакалавриата.
Данные для составления рейтинга брались из открытых источников, а также проводились опросы среди 150 работодателей о востребованности выпускников и среди 12 000 студентов, которых спрашивали о качестве подготовки в вузе.
Среди топовых вузов первое место по качеству подготовки специалистов в сфере ИИ заняла Высшая школа экономики. Второе и третье места достались Университету ИТМО и МФТИ. Пятёрку лучших замыкают МГУ и СПбГУ.
В рейтинг вошли 203 российских университета, реализующих программы специалитета и бакалавриата.
Данные для составления рейтинга брались из открытых источников, а также проводились опросы среди 150 работодателей о востребованности выпускников и среди 12 000 студентов, которых спрашивали о качестве подготовки в вузе.
Среди топовых вузов первое место по качеству подготовки специалистов в сфере ИИ заняла Высшая школа экономики. Второе и третье места достались Университету ИТМО и МФТИ. Пятёрку лучших замыкают МГУ и СПбГУ.
❤11
Data Scientist в Сбер
От 160.000₽
Офис в Санкт-Петербурге
Предстоит: проведение аудиторских проверок статистических, ML моделей, автоматизированных алгоритмов; диагностирование и поиск проблем в банковских процессах, автоматизированных решениях (моделях, алгоритмах)…. Узнать подробнее🔵
От 160.000₽
Офис в Санкт-Петербурге
Предстоит: проведение аудиторских проверок статистических, ML моделей, автоматизированных алгоритмов; диагностирование и поиск проблем в банковских процессах, автоматизированных решениях (моделях, алгоритмах)…. Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
AI Engineer: советы от рекрутера
Всегда приятно приоткрыть завесу тайн и узнать, чего же ждут специалисты по найму от кандидатов. Поэтому мы нашли статью опытного рекрутера, который рассказал о том, что он и его коллеги ищут в кандидатах на должность AI-Engineer:
1️⃣ Мало кто любит тратить время впустую, поэтому когда рассказываете о своем опыте — поменьше деталей (только если HR уточнит детали сам) и больше конкретики.
HR хочет узнать две вещи:
— Можете ли вы решать реальные проблемы?
— Можете ли ясно изложить ход своих мыслей?
Здесь вы:
— Показываете, что сделали сами.
— Демонстрируете влияние на бизнес.
— Оставляете пространство для вопросов.
А ещё это сигнал, что вы уверены в своих решениях — и это большой плюс!
2️⃣ Инженеры 🚫 исследователи
Исследователям нужно быть в тренде и знать последние технологии. По сравнению с ними, AI-инженеры могут расслабиться и узнавать о новых разработках не так часто.
❗ Предупреждение: совсем не узнавать о новых разработках не получится, тк вы рискуете не поспеть за новыми трендами и инструментами.
Пример идеального ответа:
HR оценит такое компромиссное мышление выше, чем знание последних статей (хотя комбинация "быть в тренде" + "компромиссное мышление" = супер!).
3️⃣ Осознание затрат — ваша суперсила.
Если работаете с LLM, это критически важно. Умение оптимизировать токены и структурировать промты — огромный плюс.
Реальный ответ одного из кандидатов:
Нужно ли говорить, что кандидата после этого сразу взяли?
Всегда приятно приоткрыть завесу тайн и узнать, чего же ждут специалисты по найму от кандидатов. Поэтому мы нашли статью опытного рекрутера, который рассказал о том, что он и его коллеги ищут в кандидатах на должность AI-Engineer:
HR хочет узнать две вещи:
— Можете ли вы решать реальные проблемы?
— Можете ли ясно изложить ход своих мыслей?
Идеальный ответ может выглядеть так:
«На последнем месте работы я создал RAG-воронку, которая сократила время ответа службы поддержки на 40%. С удовольствием расскажу, как я её структурировал.»
Здесь вы:
— Показываете, что сделали сами.
— Демонстрируете влияние на бизнес.
— Оставляете пространство для вопросов.
А ещё это сигнал, что вы уверены в своих решениях — и это большой плюс!
Исследователям нужно быть в тренде и знать последние технологии. По сравнению с ними, AI-инженеры могут расслабиться и узнавать о новых разработках не так часто.
Пример идеального ответа:
«Я пробовал fine-tune датасет контрактов, но модель часто давала сбои. Перешёл на гибридный RAG с Elasticsearch — потерял часть нюансов, но добился стабильности.»
HR оценит такое компромиссное мышление выше, чем знание последних статей (хотя комбинация "быть в тренде" + "компромиссное мышление" = супер!).
Если работаете с LLM, это критически важно. Умение оптимизировать токены и структурировать промты — огромный плюс.
Реальный ответ одного из кандидатов:
«Сократив число запросов и закэшировав встроенные функции, мы снизили затраты компании на 70%. Вот сравнение расходов до и после.»
Нужно ли говорить, что кандидата после этого сразу взяли?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12
Пока Цукерберг забирает талантов из OpenAi, Илон Маск забирает таланты у Meta
С января этого года Илон Маск переманил к себе в xAi по крайней мере 14 исследователей и инженеров из Meta.
Среди бывших работников Meta Маск забрал к себе: Синьлэй Чен, который был научным сотрудником в FAIR и фокусировался на мультимодальных системах. Шэн Сен, который помог масштабировать модели Llama — также присоединился к xAI в апреле, согласно его профилю в LinkedIn.
Санта-Барбара какая-то🔵
С января этого года Илон Маск переманил к себе в xAi по крайней мере 14 исследователей и инженеров из Meta.
Среди бывших работников Meta Маск забрал к себе: Синьлэй Чен, который был научным сотрудником в FAIR и фокусировался на мультимодальных системах. Шэн Сен, который помог масштабировать модели Llama — также присоединился к xAI в апреле, согласно его профилю в LinkedIn.
Санта-Барбара какая-то
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25
Подборка открытых вакансий 🔵
Стажер Data-Science в Теле2
Офис / Гибрид в Москве
Инженер роботизированной техники в Автомакон
До 110.000₽
Офис в Мытищи
Middle Data Scientist в Точка
До 360.000₽
Удаленно
Middle Data Scientits в Сбер
Офис / Гибрид в Москве
Middle Data Analyst в IVI
Middle/Senior Data Analyst в Lamoda
Офис / Гибрид в Москве
ML-разработчик в Яндекс
Senior Data Engineer в Ozon
Senior+ MLOps в Мегафон
Офис / Гибрид в Москве
Стажер Data-Science в Теле2
Офис / Гибрид в Москве
Инженер роботизированной техники в Автомакон
До 110.000₽
Офис в Мытищи
Middle Data Scientist в Точка
До 360.000₽
Удаленно
Middle Data Scientits в Сбер
Офис / Гибрид в Москве
Middle Data Analyst в IVI
Middle/Senior Data Analyst в Lamoda
Офис / Гибрид в Москве
ML-разработчик в Яндекс
Senior Data Engineer в Ozon
Senior+ MLOps в Мегафон
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Гайд по построению ML-моделей
Очень часто исследователи совершают одни и те же ошибки при создании своих ML-моделей. Чтобы избежать типичных (и не только) ошибок, предлагаем прочитать этот гайд.
В руководстве подробно описано, о чём нужно помнить перед построением модели, а также как оценивать и представлять результаты.
Очень часто исследователи совершают одни и те же ошибки при создании своих ML-моделей. Чтобы избежать типичных (и не только) ошибок, предлагаем прочитать этот гайд.
В руководстве подробно описано, о чём нужно помнить перед построением модели, а также как оценивать и представлять результаты.
❤13
Media is too big
VIEW IN TELEGRAM
Интервью с сотрудницей OpenAI
Янви — действующая сотрудника OpenAi и экс-сотрудница Google и Microsoft. В своем интревью она рассказала о пути в AI-инженерии: о стажировках и работе в бигтехе, текущей работе в OpenAI и критериях выбора места работы. Интервью довольно объёмное, поэтому мы оставили только самое интересное:
🟦 Янви упоминула, как она развивала свои навыки в AI-инженерии:
➖ Обучение через практику — поскольку отрасль меняется быстро, а материалы устаревают, лучший способ учиться — действовать. Она активно участвовала в хакатонах (внутренних и внешних), пробуя новые технологии в реальных проектах.
➖ Также Янви параллельно следила за трендами через блоги, статьи, книги (например, по AI-инженерии от Чип Хуен) и курсы (вроде лекций Андрея Карпаты).
🟦 И самое интересное, Янви расскрыла чем же она занимается в OpenAI:
Янви — инженер по безопасности. Её команда отвечает за то, чтобы разработка AGI приносила человечеству пользу, а не вредила. Среди основных задач она выделила:
➖ Детекция вредоносного использования — разработка классификаторов для выявления опасных действий (jailbreak, эксплуатация уязвимостей) в реальном времени.
➖ Обучение моделей на актуальных данных, масштабирование и мониторинг.
➖ Исследование рисков — например, новых способов обхода ограничений у мощных моделей.
Ну и конечно, она сранивала свою текущую работу с работой в Google и Microsoft. По ее слова в этих двух компаниях больше бюрократии, а в OpenAI решения принимаются быстрее. Приэтом, у OpenAI есть миссия — создание AGI, которое требует баланса между инновациями и ответственностью.
Полное видео интревью
Янви — действующая сотрудника OpenAi и экс-сотрудница Google и Microsoft. В своем интревью она рассказала о пути в AI-инженерии: о стажировках и работе в бигтехе, текущей работе в OpenAI и критериях выбора места работы. Интервью довольно объёмное, поэтому мы оставили только самое интересное:
«На одном из хакатонов я экспериментировала с function calling в OpenAI, превращая текстовые запросы в вызовы API (например, интеграция с Gmail для проверки непрочитанных писем)».
Янви — инженер по безопасности. Её команда отвечает за то, чтобы разработка AGI приносила человечеству пользу, а не вредила. Среди основных задач она выделила:
Ну и конечно, она сранивала свою текущую работу с работой в Google и Microsoft. По ее слова в этих двух компаниях больше бюрократии, а в OpenAI решения принимаются быстрее. Приэтом, у OpenAI есть миссия — создание AGI, которое требует баланса между инновациями и ответственностью.
Полное видео интревью
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11
Подборка открытых вакансий 🔵
Стажер Data Scientist в МТС
Офис в Москве
Senior NLP Engineer в Just AI
Удаленно / Гибрид / Офис в Санкт-Петербурге
GenAI Researcher в ИТМО
До 280.000₽
Гибрид / Офис в Санкт-Петербурге
Middle/Senior Data Analyst в Авиасейлс
Удаленно
Middle/Senior Data Analyst в Beeline
Удаленно
Middle+/Senior Data Scientist в 2GIS
Удаленно
Senior Data Scientist в Wildberries
Удаленно / Гибрид / Офис в Москве
Senior Data Analyst в X5 Tech
Гибрид / Офис
Junior Инженер-исследователь в Яндекс
Офис в Москве
Middle/Senior CV Engineer в Т-Банк
Гибрид / Офис
Стажер Data Scientist в МТС
Офис в Москве
Senior NLP Engineer в Just AI
Удаленно / Гибрид / Офис в Санкт-Петербурге
GenAI Researcher в ИТМО
До 280.000₽
Гибрид / Офис в Санкт-Петербурге
Middle/Senior Data Analyst в Авиасейлс
Удаленно
Middle/Senior Data Analyst в Beeline
Удаленно
Middle+/Senior Data Scientist в 2GIS
Удаленно
Senior Data Scientist в Wildberries
Удаленно / Гибрид / Офис в Москве
Senior Data Analyst в X5 Tech
Гибрид / Офис
Junior Инженер-исследователь в Яндекс
Офис в Москве
Middle/Senior CV Engineer в Т-Банк
Гибрид / Офис
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8