Telegram Group Search
ML Data Engineer в Сбер
Офис в Москве

Предстоит: разрабатывать инструменты для валидации и замера качества моделей; создавать метрики оценки производительности и точности LLM …. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Не в оффере счастье, а в пути к нему 🍜
Please open Telegram to view this post
VIEW IN TELEGRAM
51
Data Analyst в Beeline
Удаленно

Предстоит: Анализ бизнес-данных из различных источников, включая работу с иерархическими справочниками и построение измерений; Разработка и оптимизация SQL-запросов для аналитики, агрегаций и бизнес-метрик; Разработка и поддержание дашбордов…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Media is too big
VIEW IN TELEGRAM
Наткнулись тут на интервью, в котором Дженсен Хуанг рассказывает о том, как устроена работа в его компании и о мотивации.

«В моём прямом подчинении 55 человек. Я не пишу оцениваю их эффективность, а даю им постоянную обратную связь, и они делают то же самое для меня… Многие из наших топ-менеджеров получают одинаковую зарплату — вплоть до доллара. И я не провожу с ними индивидуальные встречи, если только они сами в этом не нуждаются. В таком случае я отброшу все дела ради них. У меня никогда не бывает встреч с ними наедине, и они никогда не слышат от меня ничего, что предназначено только для их ушей. Нет ни единого фрагмента информации, который я бы по секрету сообщил «исполнительному составу» и не рассказал бы всей остальной компании. Таким образом, наша компания создана для маневренности, для максимально быстрого потока информации, для того, чтобы люди были воодушевлены тем, что они делают, — а не тем, что они знают».


Что касается мотивации. Хуанг считает, что лучшая мотивация для сотрудника — личный пример. То как вы реагируете на удачи или плохие результаты, что для вас важно и не важно? Такими вопросами задается Дженсен Хуанг днями напролет.
26
Senior Applied Research Scientist in Nvidia
Office


What To Do: Working with our team of researchers to develop efficient and performant models and pipelines that extract text content from images, video, audio and other modalities; Building vision pipelines for document ingestion, including page layout analysis, object detection, and OCR..... find out more 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
8
Отличный ресурс для подготовки к интервью

Репозиторий составил ML-инженер, который проходил собеседования в крупные tech-компании, такие как Google, Meta или Apple. Он выделил общие этапы всех собеседований и добавил ресурсы для подготовки, кратко об основных этапах:

1️⃣ этап — общее программирование. В зависимости от компании, у вас может быть 1-2 раунда по разработке ПО. Обычно это задачи в стиле Leetcode, но автор репозитория также рекомендует ознакомиться с educative.io, где опубликованы полезные курсы для подготовки, а также с Exponent — это тоже онлайн-платформа с курсами, но её отличием являются мок-сессии для тренировки прохождения собеседований.

2️⃣ этап — ML-интервью.
В зависимости от компании этот этап могут пропустить. Из личного опыта автора: на таком собеседовании могут встретиться вопросы про регрессию, алгоритм k-средних, деревья решений, CNN, RNN, TF-IDF и другие базовые темы.

3️⃣ этап — ML System Design.
Этот этап отличается тем, что на большинство вопросов нет правильного ответа. Цель такого собеседования — оценить вашу способность масштабировать и проектировать ML-систему для производства.

4️⃣ этап — агентные системы.
Agentic AI — стильно, модно, молодежно, поэтому рекрутеры активно нанимают специалистов со знанием агентного ИИ. Чтобы не отставать от текущей практики — начинаем знакомиться м основами здесь.

5️⃣ этап — поведенческое интервью.
Чаще всего оценка этого интервью осуществляется по методике STAR. Среди распространённых вопросов: «Почему вы хотите здесь работать?», «Как вы управляете проектами в условиях давления?», «Расскажите о случае, когда вы совершили ошибку» и т.д.
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Подборка открытых вакансий 🔵

Ведущий специалист Data Science в МТС
Офис в Москве

Middle Data Engineer в СовкомБанк
Офис в Казани и Санкт-Петербурге

Senior Data Scientist в ЦИАН
Удаленно / Гибрид / Офис в Москве, Санкт-Петербурге
, Новосибирске

Middle/Senior Data Analyst в Wildberries
Гибрид / Офис в Москве

Middle/Senior Data Analyst в Beeline
Удаленно

Senior Data Engineer в 2GIS
Удаленно


Data Scientist в Авито
Удаленно / Гибрид / Офис в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Неожиданно: OpenAI анонсирует платформу найма на базе ИИ

По словам представителя, сервис получит название OpenAI Jobs Platform и позволит компании составить серьёзную конкуренцию LinkedIn. Запуск платформы запланирован на середину 2026 года.

Гендиректор OpenAI Applications Фиджи Симо объявил о новом проекте в четверг, заявив, что компания «будет использовать ИИ, чтобы находить идеальное соответствие между потребностями компаний и возможностями соискателей».

Примечательно, что эта платформа может сделать OpenAI прямым конкурентом LinkedIn, соучредителем которой является Рид Хоффман — один из первых инвесторов OpenAI. При этом LinkedIn принадлежит Microsoft, крупнейшему инвестору OpenAI 🤷‍♂️
Please open Telegram to view this post
VIEW IN TELEGRAM
14
Гайд от Маска по созданию ИИ-стартапа:
49
Собеседование на позицию Senior ML-инженера

Нашли тут историю одного инженера, который собеседовался в FAANG: первое, что он сделал, чтобы получить работу — схитрил в своем профиле LinkedIn. Он указал, что проживает в Лондоне (хотя на самом деле находился в другой стране), и немного подкорректировал свой недавний опыт. Внезапно ему начали приходить приглашения на собеседования. Инженер даже начал ощущать себя обманщиком, так как ему приходили отклики на позиции ведущего или старшего ML-инженера. Но самое интересное, что он обнаружил: вопросы на ML-Engineer и Senior ML-Engineer примерно одинаковые. Удивительно, правда? 👀

Также автор истории заметил, что на руководящих должностях часто акцент делается на гибких навыках: как кандидат справляется с неудачами, конфликтами в команде, взаимодействует с другими подразделениями и т.д.

Что касается самого процесса собеседования: технические интервью в стиле LeetCode для сеньерской позиции почти ничем не отличались от вопросов на должность ML-инженера. Задания, которые даются на дом, также оказались не сложнее, чем для рядового инженера. То же самое наблюдалось и с другими типами интервью, кроме поведенческого: для сеньерской позиции компании сосредотачивались на неудачах, управлении конфликтами и межкомандном сотрудничестве.

Существенная разница в технических собеседованиях была у Research Engineer. Там кандидата спрашивают, например, как JPEG сжимает изображения? Как вычислить n-ное число Фибоначчи за O(log n)? Зачастую на такой должности требуют решать много задач типа «преобразовать математические данные в код» или «разбить на части и улучшить».

Для себя автор выделил общий ход собеседований:
1️⃣ этап — разговор с рекрутером, на котором вы обсуждаете резюме, ваши знания о компании и причину, почему вы хотите там работать.
Предупреждение: даже на этом этапе существует вероятность отказа. Например, если рекрутер сочтет, что вам не интересна эта должность или ваши карьерные планы не соответствуют обязанностям.

2️⃣ этап — техническое интервью. Его могут разделить на 2 части: задание на дом с последующим обсуждением или live-кодирование по ML.

3️⃣ этап — тоже техническое интервью, но уже посвященное системному проектированию.

На втором и третьем этапах важно сосредоточиться на качестве, а не на количестве. Хороший способ продемонстрировать профессионализм — задать уточняющие вопросы после получения задания. И внимательно его прочитать. Слишком часто люди все делают неправильно и даже не проверяют ограничения.

4️⃣ этап — поведенческое интервью.
Этот этап обычно предназначен для всего, что не было охвачено ранее. Некоторые компании проводят три этапа, объединяя третий и четвертый.
Please open Telegram to view this post
VIEW IN TELEGRAM
20
Стартерпак любого ML-инженера:
82
Подборка открытых вакансий 🔵

Junior Data аналитик в Сбер
Офис в Москве

Middle Data Scientist (NLP) в Bia Technologies
Удаленно / Офис / Гибрид в Санкт-Петербурге, Омске, Владимире, Тамбове

Middle MLOps Engineer в Positive Technology
Удаленно / Офис / Гибрид в Москве, Нижнем Новгороде, Самаре, Новосибирске, Санкт-Петербурге, Томске


Senior Data Engineer в Спортмастер
Удаленно / Офис / Гибрид в Москве

Middle/Senior ML Analyst в Kaspersky
Офис / Гибрид в Москве

Middle/Senior Data Scientist в Альфа Банк
Офис / Гибрид в Москве


Middle Data Engineer в Яндекс
Офис / Гибрид


Middle ML Engineer в VK Team
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Разбор вопроса с собеседования: Как объяснить ситуацию, когда у модели высокий ROC-AUC, но низкий PR-AUC? Какой показатель надежнее на несбалансированных данных и почему?

Разбираемся со всем по порядку:
ROC-AUC показывает, насколько хорошо модель ранжирует объекты — то есть отделяет положительные примеры от отрицательных в целом. Сравнивает True Positive Rate с False Positive Rate.

PR-AUC фокусируется только на положительном классе. Его интересует, сколько из предсказанных положительных примеров действительно верны (precision) и насколько модель полная (recall).

Так как выборка не сбалансирована, то высокий ROC-AUC может сохраняться потому, что даже при большом числе ложноположительных срабатываний False Positive Rate может оставаться низким. Это происходит из-за огромного количества истинно отрицательных примеров в знаменателе формулы FPR = FP / (FP + TN).

Низкий PR-AUC возникает потому, что Precision резко падает даже при небольшом количестве ложноположительных срабатываний, если истинно положительных примеров очень мало. В формуле Precision = TP / (TP + FP) знаменатель сильно страдает от любых FP.

Так какой показатель надежнее?
В несбалансированных задачах лучше отдавать предпочтение PR-AUC. Он лучше отражает реальную эффективность модели, так как сфокусирован на качестве предсказания редкого положительного класса и критичен к ложным срабатываниям, а ROC-AUC полезен для оценки общей ранжирующей способности модели.
38
Вы работаете с данными, но хотите более разнообразных задач?

Вам нужно перейти в Data Science. До 15 сентября в Вышке продолжается набор на онлайн-магистратуру «Магистр по наукам о данных». Поступить можно даже без технического бэкграунда, а учиться — в удобном формате. За время обучения вы станете:
⚪️ Data Scientist
⚪️ ML Engineer

Что вы получите, когда поступите?
⚪️ качественное обучение на очной программе в онлайн-формате
⚪️ возможность стать специалистом в области DS без бэкграунда
⚪️ отсрочка от армии, льготный проезд и другие студенческие привилегии
⚪️ практические проекты, которые можно сразу включить в портфолио
⚪️ диплом государственного образца очной магистратуры.

Во время обучения студенты выходят на позиции Junior DS и Junior ML Engineer или идут по академическому пути.

📕 Узнать больше о поступлении

А чтобы узнать, как подать документы, вступайте в чат абитуриентов — там найдете инструкции и сможете получить ответы на любые вопросы о программе.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Data Scientist / ML-инженер в НМГ

Предстоит: создание моделей для задач NLP и CV; доработка и улучшение существующих моделей; анализ данных из социальных сетей: классификация, кластеризация, определение сущностей, выявление аномалий…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Исследование Fastly показало, что опытные разработчики чаще используют ИИ для генерации кода

В опросе участвовал 791 разработчик, почти треть из которых с опытом более 10 лет. Оказалось, что более половины кода у сеньер-разработчиков написан с помощью ИИ. Этот показатель более чем вдвое превышает результат джунов (с опытом до двух лет): среди них об этом сообщили лишь 13%.

При этом 28% респондентов признались, что часто тратят столько времени на исправление ИИ-кода, что преимущества ИИ сводятся на нет. Ещё 14% заявили, что редко вносят существенные правки.

Тем не менее, более половины участников отметили, что ИИ-инструменты (включая GitHub Copilot, Google Gemini и Anthropic Claude) помогают им работать быстрее. Старшие инженеры проявили больший энтузиазм: 59% из них констатировали рост скорости работы против 49% среди младших коллег.
8
ML Engineer в RedCatAi
Удаленно (Проектная работа)

Предстоит: Разрабатывать новых агентов в мультиагентной системе ассистента; Разрабатывать и поддерживать MCP-серверы для интеграции внешних источников; Работать с Elasticsearch: настройка поиска, оптимизация индексов, расширение возможностей RAG…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Инженер данных КХД в Ekleft
От 300.000 до 475.000₽
Удаленно / Гибрид / Офис в Москве

Предстоит: проектировать и разрабатывать ETL/ELT процессы; создавать объекты хранилища и витрины данных на базе Greenplum, Clickhouse; улучшать имеющуюся функциональность и разрабатывать новую... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Media is too big
VIEW IN TELEGRAM
Оу, наткнулись на архивное интервью с Хуангом, где он еще без своей легендарной кожаной куртки. В котором молодой глава NVIDIA рассказывает о принципе, который используется во всех подразделениях его компании:

Идеальное исполнение простой идеи > реализации грандиозной идеи.

Когда меня спрашивают, почему мы не сделали то или это. Мне хочется сказать, что проблема была не в том, что у нас не хватило ума придумать это. Вы, как компания, вы, как инженерная команда или как новатор, должны принять решение и сказать: "Мне не нужно менять мир за одну ночь. Я буду менять мир следующие 50 лет. Мне не нужно создавать продукт-убийцу за одну ночь. Мне просто нужно создать продукт-победитель".

Цель такой победы — получить право на следующий ход и остаться в игре надолго.


Перевод на мл-язык: если вы думаете над созданием своей модели, то лучше сделать ее простой и при этом тщательно подготовить данные, провести кучу тестов и хорошо ее натренировать, чем тренировать большие модели, но с довольно посредственным результатом.
19
Data Scientist в Мегафон
Гибрид / Офис в Москве

Предстоит: Cоздание, внедрение и доработка классических и глубоких моделей для скоринга, поведенческого моделирования, а также мультимодальных (смс + поведение); Ведение R&D-проектов с нуля до стадии рабочего MVP... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
2025/09/14 14:07:17
Back to Top
HTML Embed Code: