Telegram Group Search
➡️ Яндекс
ML Engineer (Anomaly Detection RnD)
Офис

➡️ 2GIS
Python-разработчик (LLM)
Удаленно

➡️ Lamoda
Data Governance Analyst
Офис

➡️ Иннотех
Data engineer (ДАДМ)
Офис

➡️ Авито
DS-инженер в команду LLM
Удаленно
Please open Telegram to view this post
VIEW IN TELEGRAM
5
В среду пройдет еще один ридинг-клаб от ИТМО AI Talent Hub

На этот раз в качестве гостя – наш главный редактор и автор @data_secrets. А поговорим про новую крутую статью от Anthropic и систему защиты LLM от джейлбрейков, которую они построили.

Встреча пройдет в среду, 12 февраля, в 18:30. Не забудь зарегистрироваться и обязательно приходи, будет интересно!
11
Недавно наткнулись на интересный блог, где автор делится своим опытом изучения математики и ML

➡️ Автор рассказывает, что его путь в мир ML начался с желания решить проблемы в своей области, и для этого идеально подходили методы ML и DL.

➡️ Своё обучение он начал с изучения математики: учебники по линейной алгебре, теории вероятностей и статистике, а также пара курсов. На математику автор выделял по 1-2 часа в день, а его план был очень прост: теория, конкретные примеры и упражнения.

➡️ Что касается ML, автору было важно не просто научиться использовать алгоритмы, но и понять их механику: как они работают и какая теория лежит в их основе.

➡️ После знакомства с основными алгоритмами и библиотекой scikit-learn, он начал изучение DL, продолжая углублять свои знания в области оптимизации и математики.

Мы рекомендуем новичкам ознакомиться с его оригинальной историей, так как автор дал множество полезных рекомендаций по литературе и курсам, которые он изучал сам.
Please open Telegram to view this post
VIEW IN TELEGRAM
16
#Точка: Data Scientist
#Удаленно
До 510.000 ₽

➡️ Кому подойдет:
Сейчас Точка ищет специалиста в команду комплаенса. Её цель – анализировать сомнительные операции клиентов с помощью методов машинного обучения. Команде важно, чтобы у тебя был опыт работы с классическим ML и нейросетями.

🚀 Откликнуться | Все вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
13
Альтман считает, что студентам следует развивать новые навыки

🟦 На недавнем интервью команда OpenAI поделилась своим видением будущего, а также дала пару советов студентам:
"Вопрос не в том, превзойдет ли ИИ человека, а в том, когда это произойдет", — говорит Сэм Альтман.


🟦 Вместе с Альтманом, директор по продукции считает, что чем раньше студенты начнут интегрировать ИИ в свою повседневную жизнь, тем лучше они будут подготовлены для новых профессий в ближайшем будущем.

🟦 Чтобы конкурировать в этом передовом мире, Альтман рекомендовал студентам развивать новые навыки, которые помогут им использовать ИИ в своих интересах.
«Навыки, которые вам понадобятся в этом мире, — это понимание того, чего хотят люди, творческое видение, быстрая адаптация, устойчивость, когда все вокруг вас меняется, и умение работать с этими инструментами, чтобы делать гораздо больше, чем люди могли бы без них», — сказал Альтман.
Please open Telegram to view this post
VIEW IN TELEGRAM
24
#Мегафон: Data Analyst (middle)
#Офис

➡️ Кому подойдет:
Мегафон анализирует большие данные, чтобы лучше понимать каждого своего абонента, поэтому компания нуждается в хорошем дата-аналитике.

🚀Откликнуться | Все вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
4
20 и 21 мая пройдет ежегодная конференция Google I/O

Каждый год Google проводит мероприятие, на котором делится своими успехами в различных областях.

В блоке посвященному ML опытные специалисты Google расскажут о передовых разработках в области ИИ, в особенности о своей модели Gemini. Кто знает, возможно, они поделятся и инсайдерской информацией касательно этой модели.

Кстати, помимо самой регистрации на конференцию, на сайте вы сможете найти прошлогодние выступления, а в качестве приятного бонуса разработчики оставили на сайте регистрации забавную игру, чтобы немного скрасить время ожидания Google I/O.
Please open Telegram to view this post
VIEW IN TELEGRAM
3
14 февраля — это не только день любви, но и прекрасный повод креативно рассказать о своих чувствах.

Группа энтузиастов решила объединить романтику и ChatGPT, создав сайт, где генерируются тематические валентинки специально для всех причастных к Data Science.

Оригинальный способ поздравить коллег ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
17
#Сбер: Аналитик данных/Data Analyst
От 120.000₽
#Офис

➡️ Кому подойдет:
В отдел управления сетью устройств самообслуживания открыта позиция аналитика данных.

🚀Откликнуться | Все вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Интервью с мастером Kaggle

Казуки Канемото в одиночку занял 8-е место среди 3559 команд, завоевав золото (с пятой попытки) на всемирном соревновании "Child Mind Institute — Problematic Internet Use".

По словам Канемото, таких результатов он смог добиться через метод проб и ошибок. После первой неудачной попытки он сильно разочаровался, но не сложил руки, а наоборот еще сильнее захотел решить задачу. Еще одним стимулом не сдаваться был сильный интерес к анализу временных рядов.

Также одной из составляющих успеха Канемото было умение играть в игры. У Kaggle есть игровой элемент: результаты соревнований отражаются в рейтинге последовательно, прямо как в онлайн-играх. Система рейтингов стимулировала соревновательный дух, что повлияло на успех.

Сам же Канемото считает, что выиграть соревнование помогла не только страсть к играм, но и его упорство, непрекращающиеся попытки, неудачи, а также умение мыслить логически.
Please open Telegram to view this post
VIEW IN TELEGRAM
29
Зачем оптимизировать, если можно купить мощную видеокарту?
39
#МТС: Middle/Senior Data Scientist [МТС Платформа жизненных сценариев]
#Офис / #Гибрид

➡️ Кому подойдет:
МТС Платформа жизненных сценариев. Сервис предсказания текущих и будущих действий пользователя для улучшения его жизненного опыта, предложения продуктов из экосистемы МТС. На этой роли будет много взаимодействия и с другими подразделениями и нужно будет разобораться с большим количеством, имеющихся в компании данных.

🚀 Откликнуться | Все вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
9
Основы оптимизации в ML

Мы нашли отличные лекции по основам оптимизации, лежащей в машинном обучении. В лекциях вы найдете все базовые темы для изучения:

Выпуклые множества и градиенты
Минимизация выпуклой функции
Метод стохастического градиентного спуска
Основы GAN
Алгоритм ERM
PAC-обучение
Марковские процессы и многое другое.

Особенно приятно, что в лекциях присутствуют выводы всех формул, что существенно облегчает изучение материала. Ссылку на курс лекций мы оставляем здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
12
#Авито: DS-специалист в Авито (Middle/Senior)
#Офис / #Гибрид / #Удаленно
ЗП от 285.000₽

➡️ Кому подойдет:
Вне зависимости от направления, Авито предлагает реальные задачи на большом масштабе — разработка алгоритмов для проверки объявлений, внедрение ML-моделей, оптимизация процессов и DS-поддержка

🚀 Откликнуться | Все вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
8
Каким бы крутым специалистом вы ни были, будь то ML-инженер или Data Scientist, необходимо уметь структурировать свой проект.

Сразу скажем: каждому эксперименту — свой каталог. Обученная модель, метрики, конфиги и логи — всё это лучше держать в отдельной папке для каждой модели.

➡️Но обо всём по порядку: первое, с чего стоит начать, — это данные. Лучше всего хранить отдельно сырые и уже обработанные данные. Это делается для того, чтобы не приходилось заново их обрабатывать или, чтобы в случае неправильной обработки можно было вернуться к исходным данным.

➡️Отдельно храните файл со скриптом обработки данных, а также отдельные файлы для обучения и экспериментов. Любителям делать всё в одном ноутбуке Jupyter — плохие новости, вам необходимо научиться работать с файловой системой. Ведь в крупных компаниях создание хорошей модели требует гораздо больше строк, чем просто from sklearn import model.

➡️Также рекомендуется использовать отдельный файл для конфигураций (например, config.yaml или config.json) и применять в коде инструменты вроде argparse или Hydra, чтобы не хардкодить параметры. Такие файлы позволяют централизованно управлять экспериментами и не хранить миллион ноутбуков.

➡️Не забывайте про хранение API-ключей. В современных проектах их множество, например, те же токены OpenAI. Но ключи нельзя хранить в коде, поэтому используйте файлы .env с помощью библиотеки python-dotenv, переменные окружения или сервисы типа AWS Secrets Manager.

➡️Обученные модели также нужно хранить отдельно, например, в model_registry/ или в артефактах MLflow.

➡️Помните про отслеживание экспериментов и логирование. Лучше всего воспользоваться готовыми инструментами, такими как TensorBoard, Kubeflow, MLflow, Weights & Biases и другими.

➡️Также для любителей ноутбуков Jupyter: необходимо хранить не только результаты экспериментов, но и выводы. И не забывайте про документацию.

Теперь вы знаете об основных моментах структурирования проекта. А для того, чтобы самому не создавать все с нуля, предлагаем изучить Cookiecutter Data Science, который предоставляет готовый шаблон проекта.
Please open Telegram to view this post
VIEW IN TELEGRAM
27
➡️ Автомакон
Аналитик по прогнозированию и ценообразованию
Удаленно
До 250.000₽

➡️ IVI
Дата-аналитик в команду контента
Офис

➡️ Wildberries
Middle+ / Senior NLP Engineer
Удаленно

➡️ Мегафон
Data Scientist LLM
Офис

➡️ VK Team
Data Engineer в команду Big Data
Удаленно
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Сегодня состоится вебинар от инженера-разработчика PyTorch на тему: Multi-Modal Tabular Deep Learning with PyTorch Frame.

В ходе доклада спикер расскажет о PyTorch Frame, который обеспечивает интеграцию с экосистемой PyTorch, включая PyTorch Geometric для передачи сообщений на основе графов по реляционным данным и Hugging Face Transformers для извлечения текстовых признаков.

Вебинар состоится сегодня в полночь по московскому времени, а зарегистрироваться можно по ссылке здесь.
5
Senior Data Analyst в Звук
Удаленно / Гибрид в Москве

Предстоит: Проектирование и организация нового слоя данных для качественного анализа; Настройка мониторинга полноты и качества; Реализация инструмента для быстрого получения данных; Улучшение инструмента прогнозирования метрик... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
ML/DS-инженер (Network Fingerprinting & Anomaly Detection)
от 100.000 до 250.000₽
Удаленно

➡️ Требования:
• ML и статистика;
• Python (PyTorch/TensorFlow, pandas, numpy, scikit-learn, XGBoost/LightGBM);
Сетевые протоколы (желательно);
• DevOps / MLOps (Docker, Git, Linux; будет плюсом опыт с CI/CD).

➡️ Чем предстоит заниматься:
• Анализ данных (EDA) и фича-инжиниринг;
• Разработка и обучение моделей;
• Построение ML-сервиса;
• Детект VPN/прокси и аномалий;
• Автоматизация и масштабирование (по желанию).

➡️ О команде:
Команда (сети\бэкенд + ML) в поисках коллеги, который поможет построить систему, которая по низкоуровневым сетевым опечаткам определяет использование VPN\прокси, подделан ли User-Agent.

🚀 Откликнуться | Все вакансии
Please open Telegram to view this post
VIEW IN TELEGRAM
9
2025/09/09 15:14:27
Back to Top
HTML Embed Code: