Telegram Group Search
Подборка открытых вакансий 🔵

Data Engineer в НМГ
Удаленно / Офис / Гибрид

Data Analyst в Сбер
От 95.000₽
Офис в Омске

Middle Data Analyst в Автомакон
До 250.000₽
Удаленно

Senior Data Analyst в Атом
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге, Набережных Челнах

Senior Data Engineer в ПСБ
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Куда бы сходить в июле? 🚀

Собрали небольшую подборку июльских мероприятий:

Java meetup. Ребята из VK AI расскажут как они масштабировали item2item и как обновляют тысячи эмбеддингов, при этом сократив потребление сети. Очень полезный митап для любителей рексис.
Когда? 9 июля 18:30.
Где? Онлайн и офлайн в Москве.


Алхимия ИИ. На вебинаре вам расскажут, что же такое нейронные сети, где их используют в промышленности и самое интересное — объяснят, где ИИ помогает в роботехнике, зачем же работу зрение.
Когда? 10 июля 19:00.

Turbo ML Conf. Программа конференции очень разнообразна, обсудят и как применять LLM для генерации музыки, и как улучшать рекомендации. А спикерами выступят не только специалисты из различных компаний, но и преподаватели ВУЗ-ов.
Когда? 19 июля.
Где? Онлайн и офлайн в Москве.


Cloud.ru Tech Lab: AI&ML. На митапе эксперты из Cloud.ru расскажут, как они автоматизировали пользовательские сценарии с помощью ИИ-агентов, а также приоткроют завесу тайн и ответят на вопрос, почему же MCP на такой хайпе и как собрать своей MCP-сервер без кода. При этом будет еще один секретный доклад.
Когда? 24 июля в 18:00.
Где? Онлайн и офлайн в Москве.
Please open Telegram to view this post
VIEW IN TELEGRAM
8
AI Engineer
Удаленно (обязательно вне РФ и РБ)

Предстоит: Проектирование и разработка PoC; участие в подготовке презентаций и технической части коммерческих предложений преимущественно для зарубежных клиентов (различные отрасли, включая HealthTech, EdTech, маркетплейсы и многое другое)... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Junior+ Data Analyst в Wildberries
Офис / Гибрид в Москве

Предстоит: Поиск аномалий в данных; Генерация и проверка гипотез; Написание скриптов поиска фродовых действий... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Assaia is looking for employees 💼

Assaia’s solutions help airports and airlines improve on-time performance, efficiency, safety, and sustainability metrics, helping them get their passengers to their destinations on time.

Assaia has the following vacancies:

➡️ Data Scientist
From 4.500€

Remote (you should be based outside Russia and Belarus)


➡️ CV Engineer
3.500 - 4.500€

Remote (you should be based outside Russia and Belarus)


Additionally, they offer:
- Always remote work and flexible schedule.
- 5 weeks of paid vacation, paid sick leave, paid relevant courses and conferences/online education/English courses.
- Regular performance reviews to make sure you enjoy your tasks, challenges, growth and salary.
- Flat hierarchy and close to zero bureaucracy, a diverse international team of smart people.
- Live team events in Europe.
Please open Telegram to view this post
VIEW IN TELEGRAM
9
Cross Entropy

Это одна из фундаментальных тем глубокого обучения, поэтому часто на технических собеседованиях можно встретить вопрос, связанный с кросс-энтропией.

Чтобы досконально изучить эту тему, предлагаем прочесть эту статью. Нам она понравилась тем, что автор приводит много примеров и пояснений, а еще в разборе есть вопросы на подумать с подробным объяснением каждого ответа.
13
Data Scientist
Удаленно

Предстоит: Разработка и дообучение LLM; Создание и оптимизация RAG-систем; Разработка, обучение и внедрение моделей машинного обучения в связке с LLM... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Подборка открытых вакансий 🔵

Senior ML Engineer в ЦИАН
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге и Новосибирске

Senior Data Scientist в Альфа Банк
Офис / Гибрид в Москве

Middle/Senior Data Analyst в Яндекс
Офис / Гибрид в Москве, Санкт-Петербурге

Стажёр Data Science в Ozon
Офис / Гибрид в Москве

Senior Data Analyst в Авиасейлс
Удаленно


Middle Data Scientist в ecom.tech
Удаленно / Офис / Гибрид
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Data Secrets | Карьера
Мира Мурати в погоне за талантами: сколько получают сотрудники секретного стартапа? 🔷 В Thinking Machines Lab — секретном стартапе бывшей сооучредительницы OpenAI Миры Мурати тех.специалисты получают от 450.000 до 500.000$ в год. 🔷 При этом это только базовая…
Недавно говорили про зарплаты исследователей в стартапах, а сколько получают инженеры бигтеха?

Цукерберг платит AI-инженерам ни много ни мало целых 480.000$. А вот специалисты по машинному обучен получают уже до 440.000$.

Цифры получены из документов, которые компании должны представлять в Министерство труда при найме иностранных работников в рамках визовой программы. То есть мы можем подглядеть фактическую зарплатную вилку (смотрим пикчи).

Хотя, если вы топовый специалист, то возможно, ваша зарплата в Meta будет оцениваться уже в миллион $.
11
📣 Очередной совет от Андрея Карпаты новичкам в ML:

«Новички часто сосредоточены на том, что делать. Я думаю, что фокус должен быть смещен на то, сколько вы это делаете. Вам следует найти то, что вам интересно и буквально вложить в это 10.000 часов времени».
Please open Telegram to view this post
VIEW IN TELEGRAM
44
This media is not supported in your browser
VIEW IN TELEGRAM
Что думают все друзья, когда я говорю, что работаю с ИИ 😐
Please open Telegram to view this post
VIEW IN TELEGRAM
38
Менеджер по анализу больших данных в Теле2
Офис / Гибрид в Москве

Предстоит: Выдвигать и проверять гипотезы, внедрять улучшения, оценивать их эффективность; Подготавливать отчеты на базе текущих источников; Систематизировать и анализировать полученную информацию... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Что нужно знать, чтоб устроиться Дата-Аналитиком?

Data Analyst — специалист, который в основном занимается подготовкой данных и их визуализацией, еще иногда можно встретить обязанности по проверке гипотез.

Минимальными навыками для аналитиков данных — знание python (numpy, pandas, matplotlib), SQL, PowerBI/Tableau/QlikView, статистика, реже в вакансиях встречается Excel и R.

Интервью на Data Analyst ничем не отличается от других должностей — созвон с рекрутером, чтобы узнать кто вы/что вы, техническое интервью, где вы решаете поставленную проблему и рассказываете про прошлые кейсы, и финальное интервью, где упор сделан на софт скилы.

Вот пример реального интервью Data Analyst в LetsGetChecked:
В описании вакансии внимание уделялось проверке данных и обеспечению их качества в сфере здравоохранения. В качестве требований к кандидату было:
Проверка и интерпретация данных, выдвижение гипотез;
Написание запросов T-SQL и опыт работы с BigData;
Стек: AWS, PowerBI/Tableau, Github/Bitbucket, Python/Powershell, Redshift DW, Jira, GitLab и Confluence;
Мониторинг и аудит качества данных.

🔷 Раунд 1: телефонное интервью.
Примерно через неделю был телефонный созвон. Во время этого звонка рекрутер в первую очередь сосредоточился на опыте и оценил знакомство с компанией.
Примерные вопросы:
Расскажите о себе?
Что вы знаете о LetsGetChecked?
Почему вас интересует должность аналитика данных, а не инженера данных?


🔷 Раунд 2: Первое техническое собеседование.
Оцениваемые компетенции: сотрудничество, технические знания и умение решать проблемы.
В этом раунде интервьюеры в первую очередь сосредоточились на ситуационных вопросах, связанных с командной работой, тестированием ПО и подходами к проверке данных. Они хотели понять, как я сотрудничал с другими и преодолевал трудности в прошлых проектах в отношении данных.

Примеры вопросов:
- Какие шаги или структуру вы используете для проверки данных и обеспечения их соответствия бизнес-требованиям?
- Как вы отлаживаете неожиданные значения NULL, которые появляются только в месте назначения, но не в источнике?
- Модели Agile и Waterfall: какую из них вы бы выбрали, учитывая сценарий?
- Как вы справляетесь с проблемами, когда ваша команда испытывает трудности?

🔷Раунд 3: Оценка.
Для этого раунда я получил документ, содержащий 10 реальных задач Transact-SQL вместе с БД MS SQL Server. Задача включала понимание всех таблиц БД, анализ модели данных и написание расширенных SQL-запросов для решения этих задач.
При изучении набора данных важно развить некоторые знания предметной области, чтобы точно интерпретировать результаты.

Примечание: будьте терпеливы; требуется обширное исследование таблиц. Вы также должны определить как прямые, так и косвенные связи между таблицами.
Были 3 простых вопроса, 5 вопросов среднего уровня и 2 сложных вопроса.

Примеры заданий:
Рассчитать продажи с начала года (SalesYTD) с указанной даты до даты окончания отчетного года.
Найдите 10 лучших сотрудников, у которых есть степень бакалавра и которые достигли самых высоких продаж.

Финальный раунд 4: Тех. собеседование.
Оцениваемые компетенции: тех.экспертиза, решение проблем и софт скилы.
Первые 30 минут раунда были сосредоточены на объяснении моего кода SQL. В это время интервьюеры задавали подробные вопросы о них. В следующие 30 минут они задавали углубленные вопросы, охватывающие как технические, так и поведенческие аспекты.
Примеры:
Объясняя мои запросы, они спрашивали, как я могу их оптимизировать?
Выберите дату, max(date2) из ​​таблицы1;
Каков вывод запроса?
Union или Union All?

Весь процесс собеседования занял около 3 недель.


Основные выводы по процессу найма:

При планировании собеседований уделяйте как можно больше времени подготовке.
Убедитесь, что ваши объяснения понятный и не отходят от темы.
Сосредоточьтесь на читабельности и оптимизации при построении запросов.
Задавайте соответствующие вопросы в конце каждого собеседования, чтобы показать свою заинтересованность в должности.
После всех собеседований запланируйте отдельную встречу для обратной связи, которая поможет вам в будущем.
Please open Telegram to view this post
VIEW IN TELEGRAM
12
Senior Database Administrator в Match Systems
От 3.000$
Удаленно / Гибрид / Офис

Предстоит: Поддержка HA PostgreSQL кластеров; Проектирование архитектурных решений и доработка существующих; Мониторинг, резервное копирование и тестирование резервных копий, анализ производительности... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Data Scientist в ecom.tech
Удаленно / Гибрид / Офис

Предстоит: Строить модели оптимизации, и решать их. Модели как линейного/линейно-целочисленного программирования, так и модели программирования в ограничениях; Взаимодействовать с бизнесом, понимать их ограничения, описывать плюсы и минусы различных подходов к оптимизации... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Как российские тех-компании работают с данными

Наткнулись на любопытное исследование: К2Тех провел опрос среди 100 различных российских компаний. Среди опрошенных IT-директора, аналитики и дата-инженеры. Результаты вышли довольно любопытными.

➡️ В ходе опроса оказалось, что 25% компаний испытывают сложности с интеграцией данных их различных источников, при этом 21% вовсе несут денежные потери из-за низкого качества данных.

➡️ В ходе опроса также выяснилось, что для повышения эффективности работы с данными 31% компаний оптимизируют процессы сбора и хранения данных, 25% инвестируют в автоматизированные инструменты очистки, а 20% делают акцент на обучении сотрудников правильному обращению с данными.

Лидеры рынка предпочитают выстраивать экосистемы управления данными, которые охватывают весь технологический цикл: от сбора и обработки до аналитики и машинного обучения. Данные превратились из вспомогательного ресурса в ключевой актив, - комментирует руководитель направления Big Data & BI К2Тех.


В целом, примерно 3 из 4 компаний планируют увеличить инвестиции в Big Data к 2026 году. Поэтому неплохо бы вспомнить о том, как работать с данными.
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Senior Data Engineer
Удаленно / Гибрид / Офис в Москве, Санкт-Петербурге, Новосибирске
(Рассматриваются кандидаты только из РФ)

Предстоит: Разработка с нуля MVP новой дата-платформы и инфраструктуры для ingest/transform; Мигрирование существующих пайплайнов с Hadoop/HDFS на новую архитектуру (S3, Kafka, Spark, ClickHouse)... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
7
RL – с чего начать?

Обучение с подкреплением – это один из самых известных разделов машинного обучения. Сейчас оно используется почти везде, особенно активно в робототехнике и больших языковых моделях. Особую популярность RL обрело после победы модели AlphaGo от DeepMind в чемпионате мира по Go в 2016 году.

Для тех, кто давно планировал погружение в RL, мы составили небольшой роадмэп того, что стоит изучить:

1️⃣ Виды RL. Помимо основных концепций: агент, среда, состояние, действия, награды, необходимо также знать, на какие типы делится обучение с подкреплением. Обычно это положительное подкрепление, отрицательное подкрепление, положительное наказание и отрицательное наказание.

Положительное подкрепление — это поощрение после выполнения действия. Мы даем поощрение, и это приводит к повтору верного действия в будущем. В отрицательном подкреплении, чтобы повысить вероятность повторения действия в будущем, наоборот, удаляют нежелательный стимул. Например, у вас болит голова, тогда вы принимаете таблетку. В данном случае вы повторите прием таблетки в будущем, чтобы удалить нежелательный стимул (боль).

Положительное наказание — это добавление нежелательного стимула после выполнения определенного неверного действия для того, чтобы снизить вероятность повтора. В отрицательном наказании, наоборот, убирается желательный стимул, что также снижает вероятность повторения действия.

На примере: если ребенок ведет себя плохо, то нежелательным стимулом станет порицание родителей. Это будет положительное наказание. Если же ребенок принес плохую оценку, то родители могут забрать у него игрушки. Это уже будет отрицательное наказание, то есть удаление желательного стимула.

Изучение лучше начать именно с положительного подкрепления и положительного наказания. Почитайте теорию и попробуйте обучить простенькую змейку.

2️⃣ Изучите основные алгоритмы. Если с типами более-менее разобрались, то RL-алгоритмы можно разделить на два вида: жадные (те, которые ищут максимальную выгоду на текущем шаге) и те, что стараются максимизировать общий результат. К первой категории таких алгоритмов как раз относятся Epsilon-Greedy и Greedy Policy Improvement, а ко второй — Q-learning, SARSA и DQN.

3️⃣ Даже если вы уже изучили линал, статистику и классический ML, то для RL этого будет недостаточно. Необходимо дополнительно изучить теорию по марковским процессам. Хорошая новость в том, что все-все знать необязательно (но рекомендуется), достаточно изучить только марковские процессы принятия решений (MDPs). В крайних случаях помогает изучение частично наблюдаемых марковских процессов (POMDP), которые могут быть полезны тогда, когда информация о состоянии агента не полная.

4️⃣ Доп. ресурсы. Разумеется, не обойтись без книги "Обучение с подкреплением" Ричарда Саттона и Эндрю Барто. 5-минутные лекции по MDPs и лекции от университета Waterloo по POMDP. Еще рекомендуем пройти бесплатный курс по RL от Hugging Face.
Please open Telegram to view this post
VIEW IN TELEGRAM
20
Senior Data Scientist
From 4.500 to 9.000€
Remote / Hybrid Cyprus, Poland

What to do: Work with large-scale data from various sources to develop ML models for (Predicting LTV, Segmenting users, Detecting anomalies); Develop algorithms to personalize the gaming experience; Analyze and validate model accuracy.... find out more 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
3
2025/08/25 16:14:52
Back to Top
HTML Embed Code: