ML Engineer (Anomaly Detection RnD)
Офис
Python-разработчик (LLM)
Удаленно
Data Governance Analyst
Офис
Data engineer (ДАДМ)
Офис
DS-инженер в команду LLM
Удаленно
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
В среду пройдет еще один ридинг-клаб от ИТМО AI Talent Hub
На этот раз в качестве гостя – наш главный редактор и автор @data_secrets. А поговорим про новую крутую статью от Anthropic и систему защиты LLM от джейлбрейков, которую они построили.
Встреча пройдет в среду, 12 февраля, в 18:30. Не забудь зарегистрироваться и обязательно приходи, будет интересно!
На этот раз в качестве гостя – наш главный редактор и автор @data_secrets. А поговорим про новую крутую статью от Anthropic и систему защиты LLM от джейлбрейков, которую они построили.
Встреча пройдет в среду, 12 февраля, в 18:30. Не забудь зарегистрироваться и обязательно приходи, будет интересно!
❤11
Недавно наткнулись на интересный блог, где автор делится своим опытом изучения математики и ML
➡️ Автор рассказывает, что его путь в мир ML начался с желания решить проблемы в своей области, и для этого идеально подходили методы ML и DL.
➡️ Своё обучение он начал с изучения математики: учебники по линейной алгебре, теории вероятностей и статистике, а также пара курсов. На математику автор выделял по 1-2 часа в день, а его план был очень прост: теория, конкретные примеры и упражнения.
➡️ Что касается ML, автору было важно не просто научиться использовать алгоритмы, но и понять их механику: как они работают и какая теория лежит в их основе.
➡️ После знакомства с основными алгоритмами и библиотекой scikit-learn, он начал изучение DL, продолжая углублять свои знания в области оптимизации и математики.
Мы рекомендуем новичкам ознакомиться с его оригинальной историей, так как автор дал множество полезных рекомендаций по литературе и курсам, которые он изучал сам.
Мы рекомендуем новичкам ознакомиться с его оригинальной историей, так как автор дал множество полезных рекомендаций по литературе и курсам, которые он изучал сам.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16
#Точка: Data Scientist
#Удаленно
До 510.000 ₽
➡️ Кому подойдет:
Сейчас Точка ищет специалиста в команду комплаенса. Её цель – анализировать сомнительные операции клиентов с помощью методов машинного обучения. Команде важно, чтобы у тебя был опыт работы с классическим ML и нейросетями.
🚀 Откликнуться | Все вакансии
#Удаленно
До 510.000 ₽
Сейчас Точка ищет специалиста в команду комплаенса. Её цель – анализировать сомнительные операции клиентов с помощью методов машинного обучения. Команде важно, чтобы у тебя был опыт работы с классическим ML и нейросетями.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤13
Альтман считает, что студентам следует развивать новые навыки
🟦 На недавнем интервью команда OpenAI поделилась своим видением будущего, а также дала пару советов студентам:
🟦 Вместе с Альтманом, директор по продукции считает, что чем раньше студенты начнут интегрировать ИИ в свою повседневную жизнь, тем лучше они будут подготовлены для новых профессий в ближайшем будущем.
🟦 Чтобы конкурировать в этом передовом мире, Альтман рекомендовал студентам развивать новые навыки, которые помогут им использовать ИИ в своих интересах.
"Вопрос не в том, превзойдет ли ИИ человека, а в том, когда это произойдет", — говорит Сэм Альтман.
«Навыки, которые вам понадобятся в этом мире, — это понимание того, чего хотят люди, творческое видение, быстрая адаптация, устойчивость, когда все вокруг вас меняется, и умение работать с этими инструментами, чтобы делать гораздо больше, чем люди могли бы без них», — сказал Альтман.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤24
#Мегафон: Data Analyst (middle)
#Офис
➡️ Кому подойдет:
Мегафон анализирует большие данные, чтобы лучше понимать каждого своего абонента, поэтому компания нуждается в хорошем дата-аналитике.
🚀 Откликнуться | Все вакансии
#Офис
Мегафон анализирует большие данные, чтобы лучше понимать каждого своего абонента, поэтому компания нуждается в хорошем дата-аналитике.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
20 и 21 мая пройдет ежегодная конференция Google I/O
➖ Каждый год Google проводит мероприятие, на котором делится своими успехами в различных областях.
➖ В блоке посвященному ML опытные специалисты Google расскажут о передовых разработках в области ИИ, в особенности о своей модели Gemini. Кто знает, возможно, они поделятся и инсайдерской информацией касательно этой модели.
➖ Кстати, помимо самой регистрации на конференцию, на сайте вы сможете найти прошлогодние выступления, а в качестве приятного бонуса разработчики оставили на сайте регистрации забавную игру, чтобы немного скрасить время ожидания Google I/O.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Аналитик данных
Удаленно
ML-разработчик в метапоиск Недвижимости
Гибрид
Data Engineer
Офис
Data Engineer (DWH)
Офис
Python-программист (рекомендательные системы, сервисы на базе ML)
Гибрид
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
14 февраля — это не только день любви, но и прекрасный повод креативно рассказать о своих чувствах.
Группа энтузиастов решила объединить романтику и ChatGPT, создав сайт, где генерируются тематические валентинки специально для всех причастных к Data Science.
Оригинальный способ поздравить коллег❤️
Группа энтузиастов решила объединить романтику и ChatGPT, создав сайт, где генерируются тематические валентинки специально для всех причастных к Data Science.
Оригинальный способ поздравить коллег
Please open Telegram to view this post
VIEW IN TELEGRAM
❤17
#Сбер: Аналитик данных/Data Analyst
От 120.000₽
#Офис
➡️ Кому подойдет:
В отдел управления сетью устройств самообслуживания открыта позиция аналитика данных.
🚀 Откликнуться | Все вакансии
От 120.000₽
#Офис
В отдел управления сетью устройств самообслуживания открыта позиция аналитика данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
Интервью с мастером Kaggle
➖ Казуки Канемото в одиночку занял 8-е место среди 3559 команд, завоевав золото (с пятой попытки) на всемирном соревновании "Child Mind Institute — Problematic Internet Use".
➖ По словам Канемото, таких результатов он смог добиться через метод проб и ошибок. После первой неудачной попытки он сильно разочаровался, но не сложил руки, а наоборот еще сильнее захотел решить задачу. Еще одним стимулом не сдаваться был сильный интерес к анализу временных рядов.
➖ Также одной из составляющих успеха Канемото было умение играть в игры. У Kaggle есть игровой элемент: результаты соревнований отражаются в рейтинге последовательно, прямо как в онлайн-играх. Система рейтингов стимулировала соревновательный дух, что повлияло на успех.
➖ Сам же Канемото считает, что выиграть соревнование помогла не только страсть к играм, но и его упорство, непрекращающиеся попытки, неудачи, а также умение мыслить логически.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤29
#МТС: Middle/Senior Data Scientist [МТС Платформа жизненных сценариев]
#Офис / #Гибрид
➡️ Кому подойдет:
МТС Платформа жизненных сценариев. Сервис предсказания текущих и будущих действий пользователя для улучшения его жизненного опыта, предложения продуктов из экосистемы МТС. На этой роли будет много взаимодействия и с другими подразделениями и нужно будет разобораться с большим количеством, имеющихся в компании данных.
🚀 Откликнуться | Все вакансии
#Офис / #Гибрид
МТС Платформа жизненных сценариев. Сервис предсказания текущих и будущих действий пользователя для улучшения его жизненного опыта, предложения продуктов из экосистемы МТС. На этой роли будет много взаимодействия и с другими подразделениями и нужно будет разобораться с большим количеством, имеющихся в компании данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
Основы оптимизации в ML
Мы нашли отличные лекции по основам оптимизации, лежащей в машинном обучении. В лекциях вы найдете все базовые темы для изучения:
➖ Выпуклые множества и градиенты
➖ Минимизация выпуклой функции
➖ Метод стохастического градиентного спуска
➖ Основы GAN
➖ Алгоритм ERM
➖ PAC-обучение
➖ Марковские процессы и многое другое.
Особенно приятно, что в лекциях присутствуют выводы всех формул, что существенно облегчает изучение материала. Ссылку на курс лекций мы оставляем здесь.
Мы нашли отличные лекции по основам оптимизации, лежащей в машинном обучении. В лекциях вы найдете все базовые темы для изучения:
Особенно приятно, что в лекциях присутствуют выводы всех формул, что существенно облегчает изучение материала. Ссылку на курс лекций мы оставляем здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12
#Авито: DS-специалист в Авито (Middle/Senior)
#Офис / #Гибрид / #Удаленно
ЗП от 285.000₽
➡️ Кому подойдет:
Вне зависимости от направления, Авито предлагает реальные задачи на большом масштабе — разработка алгоритмов для проверки объявлений, внедрение ML-моделей, оптимизация процессов и DS-поддержка
🚀 Откликнуться | Все вакансии
#Офис / #Гибрид / #Удаленно
ЗП от 285.000₽
Вне зависимости от направления, Авито предлагает реальные задачи на большом масштабе — разработка алгоритмов для проверки объявлений, внедрение ML-моделей, оптимизация процессов и DS-поддержка
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8
Каким бы крутым специалистом вы ни были, будь то ML-инженер или Data Scientist, необходимо уметь структурировать свой проект.
Сразу скажем: каждому эксперименту — свой каталог. Обученная модель, метрики, конфиги и логи — всё это лучше держать в отдельной папке для каждой модели.
➡️ Но обо всём по порядку: первое, с чего стоит начать, — это данные. Лучше всего хранить отдельно сырые и уже обработанные данные. Это делается для того, чтобы не приходилось заново их обрабатывать или, чтобы в случае неправильной обработки можно было вернуться к исходным данным.
➡️ Отдельно храните файл со скриптом обработки данных, а также отдельные файлы для обучения и экспериментов. Любителям делать всё в одном ноутбуке Jupyter — плохие новости, вам необходимо научиться работать с файловой системой. Ведь в крупных компаниях создание хорошей модели требует гораздо больше строк, чем просто from sklearn import model.
➡️ Также рекомендуется использовать отдельный файл для конфигураций (например, config.yaml или config.json) и применять в коде инструменты вроде argparse или Hydra, чтобы не хардкодить параметры. Такие файлы позволяют централизованно управлять экспериментами и не хранить миллион ноутбуков.
➡️ Не забывайте про хранение API-ключей. В современных проектах их множество, например, те же токены OpenAI. Но ключи нельзя хранить в коде, поэтому используйте файлы .env с помощью библиотеки python-dotenv, переменные окружения или сервисы типа AWS Secrets Manager.
➡️ Обученные модели также нужно хранить отдельно, например, в model_registry/ или в артефактах MLflow.
➡️ Помните про отслеживание экспериментов и логирование. Лучше всего воспользоваться готовыми инструментами, такими как TensorBoard, Kubeflow, MLflow, Weights & Biases и другими.
➡️ Также для любителей ноутбуков Jupyter: необходимо хранить не только результаты экспериментов, но и выводы. И не забывайте про документацию.
Теперь вы знаете об основных моментах структурирования проекта. А для того, чтобы самому не создавать все с нуля, предлагаем изучить Cookiecutter Data Science, который предоставляет готовый шаблон проекта.
Сразу скажем: каждому эксперименту — свой каталог. Обученная модель, метрики, конфиги и логи — всё это лучше держать в отдельной папке для каждой модели.
Теперь вы знаете об основных моментах структурирования проекта. А для того, чтобы самому не создавать все с нуля, предлагаем изучить Cookiecutter Data Science, который предоставляет готовый шаблон проекта.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤27
Аналитик по прогнозированию и ценообразованию
Удаленно
До 250.000₽
Дата-аналитик в команду контента
Офис
Middle+ / Senior NLP Engineer
Удаленно
Data Scientist LLM
Офис
Data Engineer в команду Big Data
Удаленно
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Сегодня состоится вебинар от инженера-разработчика PyTorch на тему: Multi-Modal Tabular Deep Learning with PyTorch Frame.
В ходе доклада спикер расскажет о PyTorch Frame, который обеспечивает интеграцию с экосистемой PyTorch, включая PyTorch Geometric для передачи сообщений на основе графов по реляционным данным и Hugging Face Transformers для извлечения текстовых признаков.
Вебинар состоится сегодня в полночь по московскому времени, а зарегистрироваться можно по ссылке здесь.
В ходе доклада спикер расскажет о PyTorch Frame, который обеспечивает интеграцию с экосистемой PyTorch, включая PyTorch Geometric для передачи сообщений на основе графов по реляционным данным и Hugging Face Transformers для извлечения текстовых признаков.
Вебинар состоится сегодня в полночь по московскому времени, а зарегистрироваться можно по ссылке здесь.
❤5
Senior Data Analyst в Звук
Удаленно / Гибрид в Москве
Предстоит: Проектирование и организация нового слоя данных для качественного анализа; Настройка мониторинга полноты и качества; Реализация инструмента для быстрого получения данных; Улучшение инструмента прогнозирования метрик... Узнать подробнее🔵
Удаленно / Гибрид в Москве
Предстоит: Проектирование и организация нового слоя данных для качественного анализа; Настройка мониторинга полноты и качества; Реализация инструмента для быстрого получения данных; Улучшение инструмента прогнозирования метрик... Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5
ML/DS-инженер (Network Fingerprinting & Anomaly Detection)
от 100.000 до 250.000₽
Удаленно
➡️ Требования:
• ML и статистика;
• Python (PyTorch/TensorFlow, pandas, numpy, scikit-learn, XGBoost/LightGBM);
• Сетевые протоколы (желательно);
• DevOps / MLOps (Docker, Git, Linux; будет плюсом опыт с CI/CD).
➡️ Чем предстоит заниматься:
• Анализ данных (EDA) и фича-инжиниринг;
• Разработка и обучение моделей;
• Построение ML-сервиса;
• Детект VPN/прокси и аномалий;
• Автоматизация и масштабирование (по желанию).
➡️ О команде:
Команда (сети\бэкенд + ML) в поисках коллеги, который поможет построить систему, которая по низкоуровневым сетевым опечаткам определяет использование VPN\прокси, подделан ли User-Agent.
🚀 Откликнуться | Все вакансии
от 100.000 до 250.000₽
Удаленно
• ML и статистика;
• Python (PyTorch/TensorFlow, pandas, numpy, scikit-learn, XGBoost/LightGBM);
• Сетевые протоколы (желательно);
• DevOps / MLOps (Docker, Git, Linux; будет плюсом опыт с CI/CD).
• Анализ данных (EDA) и фича-инжиниринг;
• Разработка и обучение моделей;
• Построение ML-сервиса;
• Детект VPN/прокси и аномалий;
• Автоматизация и масштабирование (по желанию).
Команда (сети\бэкенд + ML) в поисках коллеги, который поможет построить систему, которая по низкоуровневым сетевым опечаткам определяет использование VPN\прокси, подделан ли User-Agent.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9