Telegram Group Search
Senior Quantitative Developer
Удаленно / Гибрид / Офис в Армении (рассматриваются кандидаты только из Армении, либо с быстрым переездом)

Предстоит: Тесное сотрудничество с технологами и исследователями над оптимизаторами портфеля, созданием сложных конвейеров данных и инфраструктур для анализа стратегии и производительности.... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Quantitative Researcher
До 15.000$
Удаленно / Гибрид / Офис в Ереван, Будапешт

Предстоит: создание алгоритмических, компьютерных моделей; проведение исследований академической количественной финансовой литературы; изучение и обработка данных... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Мир, труд, май коллеги. Пусть ваши функции всегда будут нужны, а ваши нейронки — понятны даже сеньорам 👍
Please open Telegram to view this post
VIEW IN TELEGRAM
Middle Data Analyst в Beeline
Офис / Гибрид / Удаленно


Предстоит: Создание регулярных отчетов для мониторинга бизнес-метрик; Ad-hoc аналитика: формирование выгрузок с помощью SQL; Детальный анализ клиентской базы: определение «точек западания», поиск инсайтов, сегментация, поведенческий анализ и т.п…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Руководство по RAG

Идеальный вариант для тех, кто хочет погрузиться в изучение RAG. Подробно расписано, что это за технология, где используется, какие проблемы возникают, и, конечно же, как создавать системы RAG с помощью LangChain и LangSmith, включая инструменты мониторинга и развертывания.

Кстати, если полистать по сайту, то можно обнаружить много полезного материала по LLM 🫶
Please open Telegram to view this post
VIEW IN TELEGRAM
Подборка открытых вакансий 🔵

ML-Engineer в Т-банк
Офис / Гибрид

Senior Data Scientist в Ozon
Офис / Гибрид

Senior Data Scientist в Yadro
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге, Нижнем Новгороде

Тимлид команды Data science в Иннотех
Удаленно / Офис / Гибрид в Самаре


Data Engineer в Авито
Удаленно / Офис / Гибрид

Senior Data Scientist в Золотое Яблоко
Удаленно / Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
Минцифры: к 2030 году в России выпустят 10 тысяч специалистов в области Data Science

Приём на программы бакалавриата в сфере ИИ начнется уже в этом учебном году, магистратуры — 2027 году. К 2030 году в рамках проекта планируется обучить более 10 тыс. студентов.

При этом ВУЗы уже разделены на два уровня: DS и Top DS. ВУЗы Top DS будут выпускать специалистов, разрабатывающих новые ML-алгоритмы, архитектуры, в общем заниматься исследованиями в области ИИ. ВУЗы DS нацелены на подготовку кадров, которой будут заниматься занимаются подготовкой и тюнингом моделей, то есть прикладными вещами.
Staff Software Engineer in Kaggle

What to do: Collaborate with the broader Kaggle team to design and implement software systems and tools that support the cutting edge of benchmarking and evaluation for AI/ML; Work with the Kaggle Competitions team to expand Kaggle's competitions platform to host and run Large Language Model (LLM) Benchmarks and community evaluations..... Find out more 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Любой из нас хотя бы раз в жизни be like:
Python-разработчик в AI инструменты
Офис / Гибрид / Удаленно в Москве


Предстоит: Разработка AI-инструментов для других разработчиков: системы автодополнения, анализа кода, генерации тестов и документации; Работа с Code Review агентами: создание, обучение и доработка нейросетевых решений для анализа качества кода…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Head of AI / ML
Офис / Гибрид / Удаленно в Москве


Предстоит: Разработка и внедрение стратегии в области искусственного интеллекта, чтобы повысить ценность нашей компании на рынке; Ведение четкой и понятной документации для всех наших AI-проектов, чтобы было ясно, как они влияют на бизнес и какие технические показатели имеют…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Показываем результаты заказчику правильно

Мечта любого инженера: заказчик с полуслова понимает все, что ты ему говоришь и показываешь. Но если фронтендеру достаточно показать красивый сайт, то мл-щику показать красивый график лосса будет недостаточно.

Как же показать результаты так, чтобы заказчик все понял? Держите пару советов от нашей редакции:

1️⃣ Помним, кому и что перезентуем: если это ваши коллеги по цеху, то достаточно показать графики ошибок модели, но если вы все же показываете результаты заказчику, то постарайтесь минимизировать использование терминов и проффесионализмов.
Показывайте легко интерпретируемые вещи, передающие главные результаты. Например, если у вас задача классификации для выявления заболевания, то нужно показать низкое значение FP, а если задача выявления аферистов в банке, то сделать упор на FN.

2️⃣ Освойте методы интерпретации: Если вы еще не знакомы с реализациями SHAP и LIME, то сейчас расскажем, что это:

LIME, не путать с лимоном. Суть метода в том, что мы берем интересующее нас наблюдение и генерируем вокруг него много похожих примеров. Затем для каждого такого примера предсказываем нашей моделью таргет. Получается набор точек, на котором можно прогнать регрессию и найти коэффициенты, которые показывают, в какой степени каждый признак влияет на предсказание для конкретного объекта.

Результаты LIME можно визуализировать при помощи столбчатой диаграммы: так они станут понятны даже очень далекому от ML человеку. Можно рассмотреть и другие визуализации: например, если вы работали с текстом, попробуйте выделить цветом слова, которые повлияли на предсказания больше всего .

SHAP. Работает немного иначе, но суть та же. Алгоритм рассматривает все возможные комбинации признаков и вычисляет их средний маржинальный вклад в результат. Вычисленные веса называются значениями Шепли, отсюда и название. Представить результаты можно с помощью диаграммы "водопад", где на абсциссе отмечены признаки, а по оси ординат отмечено, как меняется предсказание модели под влиянием каждого признака.

3️⃣ Работа с текстами и изображениями. Если вы работали не с таблицами, а с текстом, используйте альтернативные методы интерпретации, такие как Integrated Gradients. Так можно будет найти особо важные для модели слова.

Для работы с изображениями подойдут такие методы, как Grad-CAM и Saliency maps. Grad-CAM позволяет визуализировать, какие области изображения наиболее важны для модели в контексте определенного предсказания. Saliency maps же показывают, какие пиксели изображения влияют на предсказание, выделяя их цветом.

4️⃣ Избегайте типичных ошибок. Типичными ошибками при презентации результатов является отсутствие подписей осей, шкалы или отсутствие легенды на графике. Также не забывайте давать признакам в презентации понятные названия. Никаких feature_1. И помните про масштабы: если вы прогнозируете выручку, то совсем необязательно писать все нули, достаточно указать масштаб.

5️⃣ Объясняйте просто. Еще раз повторимся: всегда помните, что заказчик не обладает теми глубокими знаниями, которыми обладаете вы. Поэтому поменьше специфичной терминологии и побольше объяснений, даже там, где кажется, что все очевидно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Подборка открытых вакансий 🔵

Junior/Middle Data Engineer в МТС
Офис в Москве

Data Scientist в HomeBuddy
Удаленно / Офис / Гибрид (Eastern Europe)

Senior СV Engineer в Атом
Удаленно / Офис / Гибрид в Москве, Санкт-Петербурге

Руководитель команды ML и R&D в Naumen
Удаленно / Офис / Гибрид


Middle Data Engineer в Альфа Банк
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
Дайджест мероприятий

Собрали небольшую подборку ближайших событий:

➡️ 7 мая (сегодня) в 19:00 пройдет вебинар, посвящённый LLM. Судя по программе, мероприятие рассчитано на начинающих ML-инженеров, ведь на вебинаре обсудят базовые концепции и методы, лежащие в основе LLM.

➡️ 20 мая состоится Yandex ICLR Recap. На встрече разработчики обсудят самые интересные темы с прошедшей Всемирной конференции ICLR: NLP, CV, тренды tabular DL и обзор ML Engineering & Search.

➡️ С 24 мая по 1 июня пройдет Data Fest. В этом году мероприятие охватывает такие города, как Москва, Питер, Новосибирск, Алматы и Белград. Секций очень много, и в каждой можно найти темы на любой вкус.

➡️ 5–8 июня в Нижнем Новгороде пройдет фестиваль Тех-Френдли викенд. Мероприятие масштабное и нацелено на молодежь: есть отдельные секции для детей и студентов. Главной темой фестиваля станет Искусственный Интеллект — спикеры расскажут про тренды в ИИ и его применение в различных областях.

➡️ 26–27 июня в культурной столице пройдет Conversations 2025, посвящённая генеративному и разговорному ИИ. На мероприятии выступят ведущие специалисты, а также пройдет церемония вручения Generation AI Awards.
Please open Telegram to view this post
VIEW IN TELEGRAM
Data Engineer в Avito
Офис / Гибрид / Удаленно в Москве


Предстоит: работать с Trino и ClickHouse, оптимизируя их взаимодействие с BI-инструментом; анализировать производительность запросов и влиять на их эффективность…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Нашли блог одного инженера, где он делится своим опытом. Особенно понравилась статья Fast LLM Inference From Scratch:

В статье разбираются:
Архитектуры LLM и основные узкие места производительности
⚙️ Оптимизации инференса на CPU: мультипоточность и квантование весов
⚙️ Ускорение на GPU: продвинутые матричные операции, фьюзинг и работа с вниманием
⚙️ Взгляд в будущее развития технологий

Также есть любопытные статьи про Diffusion Models и Perspective-Correct Interpolation.
Please open Telegram to view this post
VIEW IN TELEGRAM
Data Engineer в Сбер
Офис в Москве


Предстоит: построение витрин больших объемов (десятки терабайт), в т.ч. с возможностью частичного перестроения; оптимизация хранения данных в Greenplum: структура, партиционирование, сжатие, разработка и ведение логической схемы данных…. Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
Для кого-то майских выходных мало, а другие трудятся в поте лица семь дней в неделю

🔷 Помните, как в прошлом году директор одного стартапа всколыхнул общественное мнение своим заявлением о работе в 80 часов? Так вот, вслед за ним стартапы все чаще находятся в поисках сотрудников, готовых работать аж семь дней в неделю.

🔷 Генеральный директор стартапа Arrowster считает, что вместо стандартной недели следует разбивать рабочее время на интенсивные сессии с отдыхом, а не на привычные пять рабочих дней и выходные. «Почему неделя из семи дней? Нет логичных причин для пяти рабочих дней и двух выходных», — отмечают в компании.

🔷 Corgi, поддерживаемая Y Combinator, также поддерживает график в семь рабочих дней в неделю, считая это необходимым для достижения целей, заявил Джош Джанг в LinkedIn.

🔷 Такая практика вовсе не нова. В Китае распространена культура «996» — с 9 до 21, шесть дней в неделю. В Греции с прошлого года введена шестидневная рабочая неделя с повышенной оплатой для некоторых отраслей. В Южной Корее ряд компаний, включая Samsung, обязали менеджеров работать шесть дней в неделю.
Please open Telegram to view this post
VIEW IN TELEGRAM
«Лев не парится с RAG.

Он вбивает сырую мощь в векторное пространство и ничего не спрашивает.

Attention — всё, что ему нужно»
2025/06/19 14:42:00
Back to Top
HTML Embed Code: