Telegram Group Search
Senior Database Administrator в Match Systems
От 3.000$
Удаленно / Гибрид / Офис

Предстоит: Поддержка HA PostgreSQL кластеров; Проектирование архитектурных решений и доработка существующих; Мониторинг, резервное копирование и тестирование резервных копий, анализ производительности... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
Как написать научную статью так, чтобы её приняли к публикации. Часть 2 — Введение, иллюстрации, таблицы и графики.

В прошлый раз мы делились советами по оформлению заголовка, рисунка и абстракта. В этот раз мы расскажем о советах по введению, иллюстрациям, таблицам и графикам:

Отсутствии проблемы во введении. Если вы сравните первую пикчу со второй, то можете заметить несколько отличий. Автор называет такое повествование циклами напряжения/разрядки. Такими циклами автор повышает значимость своего исследования: абзацы 1 и 2 создают напряжение, описывая проблему, а абзац 3 представляет решение (разрядка). Также автор добавляет слова, которые создают контраст: «но», «сложно», «в то время как X, Y», «к сожалению».

Добавляя такие циклы, автор показывает, что его задача является конкретной, сложной, ценной и уникальной. В первом абзаце обозначаем проблему, во втором абзаце наращиваем эту проблему, в третьем пишем наш вклад в решение этой проблемы — идеальный рецепт введения. Кстати, автор приложил лекцию о том, как идеально писать хорошие тексты. Мед 🍯

Совет: ваш текст должен нести ценность (которая часто является развлечением).

Оставшаяся часть статьи. Здесь вам может помочь тактика наоборот:

Подумайте обо всех причинах, по которым рецензент может отклонить вашу статью. Избегайте это.

Однако тактика не сработает, если в вашей работе нет полноты и ясности:

1️⃣ Сделайте фигуры понятными и красивыми.
В оригинальной статье у автора была очень сложная часть pivot-branch sampling, хоть и большую часть он перенёс в приложение, но чтобы придать ясности о том, почему это важно, в этом должна была помочь картинка. Но ясности она не внесла. Поэтому в исправленный вариант автор добавил графики (см. третью картинку в посте). Ещё обратите внимание, что иллюстрация стала ярче, пропали серые пояснения.

2️⃣ Придумайте удобные обозначения. Здесь стоит сказать о примерах: очень важно указывать подходящие примеры, ведь так ваша работа будет выглядеть гораздо презентабельнее + это вносит ясность в работу. Но здесь может таиться проблема: иногда примеры бывают уж очень громоздкими. Поэтому автор рекомендует придумать удобные обозначения.

Но здесь осторожно: общепринятые обозначения лучше использовать по назначению и не придумывать им новый смысл, иначе проверяющий будет в недоумении 🤔

На четвёртой картинке вы можете видеть, как выглядит таблица с обозначениями. Автор вместо громоздких ссылок оставил короткие обозначения, и так сразу повысилась читабельность таблицы.

3️⃣ Добавьте графики для разнообразия. У графиков есть несколько замечательных свойств: они убирают монотонность текста и обеспечивают наглядность. Просто взгляните на последнюю картинку — теперь наглядно видны результаты исследования + сам текст воспринимается теперь иначе. Не забывайте размещать выводы в конце подписи.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
10
Подборка открытых вакансий 🔵

Data Engineer в Теле2
Офис / Гибрид в Москве

Middle NLP engineer в Сбер
Офис / Гибрид в Москве

Senior Data Analyst в Garage Eight
Офис / Гибрид в Москве

Senior ML Developer в МТС
Удаленно / Офис / Гибрид в Москве

MLOps Engineer в Атом
Офис в Москве

Junior/Middle Data Science в Иннотех
Удаленно / Офис / Гибрид в Новосибирске
Please open Telegram to view this post
VIEW IN TELEGRAM
5
Вакансия от подписчика:
Junior DS/NLP/Промпт инженер в стартап
Удаленно


Стартап создает сервис, который в режиме реального времени анализирует диалог двух людей и подсказывает одному из них как вести коммуникацию более эффективно. Финансирование пока отсутствует, но у ребят очень амбициозные планы на свой сервис... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Почему нужно обновлять свое резюме ежегодно: советы от бывшего инженера Microsoft

По словам ex-инженера Microsoft, всем причастным к IT необходимо обновлять свое резюме каждые 6-9 месяцев.
«Инженеры, как правило, смотрят вперед и забывают о своих достижениях, которые совершали в далеком прошлом», — сказал он.


Помимо того, что вы можете сравнить свои текущие результаты с прошлыми, обновление резюме служит инструментом самопроверки.

Также поводом обновить резюме служат отзывы о работе. Если ваши начальники используют все возможные метрики для оценки вашей эффективности, то почему бы ими не воспользоваться вам?

Еще одним "за" регулярное обновление является то, что вы всегда будете на виду у рекрутеров, таким способом вы сможете понять свою востребованность как специалиста.
Please open Telegram to view this post
VIEW IN TELEGRAM
8
Senior Data Engineer
От 250.000 до 300.000₽

Удаленно на территории РФ

Предстоит: Миграция из Managed Service в собственные Kubernetes; Разработка модулей и скриптов данных для пилота; Разработка скриптов для повышения качества данных... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Senior Data Engineer
От 300.000₽

Офис / Гибрид в Санкт-Петербурге

Предстоит: Поиск и интеграция источников данных; Проектирование и оптимизация ETL/ELT пайплайнов; Контроль качества данных ... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
4
NeurIPS недавно запустил свой хакатон — Open Polymer Prediction 2025 🚀

Цель: построить модель, которая на основе структуры полимера предскажет его химические свойства.

Данные представлены в виде текста, и вам необходимо будет предсказать 5 основных показателей: Tg, FFV, Tc, Density и Rg.

Призовой фонд составляет 50 000 долларов. Последний срок подачи решений — 15 сентября.
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Data Scientist / AI Engineer в RR Group
Удаленно

Предстоит: Разработка AI-системы, которая через чат/мессенджер: понимает текстовые запросы пользователей, формирует SQL-запросы... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
10
Подборка открытых вакансий на должность Data Engineer 🔵

Data Engineer в Авито
Офис / Гибрид / Удаленно в Москве

Senior Data Engineer в Яндекс
Офис / Гибрид / Удаленно

Middle Data Engineer в VK Team
Офис / Гибрид / Удаленно в Москве

Junior/Middle Data Engineer в Иннотех
Удаленно / Офис / Гибрид в Екатеринбурге

Junior/Middle Data Engineer в СовкомБанк
Офис / Гибрид в Казани, Санкт-Петербурге, Воронеже

Senior Data Engineer в Ozon
Офис / Гибрид
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Chief Artificial Intelligence Officer (CAIO)

Предстоит: Формировать и реализовывать стратегию искусственного интеллекта на уровне всей экосистемы; Определять, запускать и масштабировать ИИ-проекты, выстраивая архитектуру, команды и управление ИИ-инфраструктурой.... Узнать подробнее 🔵
Please open Telegram to view this post
VIEW IN TELEGRAM
5
VibeCoding: где обитают самые ленивые программисты

Энтузиасты решили проанализировать коммиты на GitHub и выяснить, как часто программисты увлекаются вайбкодингом. Ребята обучили свой классификатор на коммитах 200 тысяч Python-разработчиков с 18 по 24 года. Вот что из этого вышло:

Первое место заняли вайбкодеры из США. На их код приходится 30% сгенерированных функций.

В топ также вошли Германия 24,3%, Франция 23,2%, Индия 21,6%, Россия 15,4% и Китай 11,7%.

В ходе исследования также выяснилось, что вайбкодингом занимаются чаще всего новые пользователи GitHub, чем их более опытные коллеги.

Ссылку на исследование оставляем здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
21
Что ценит DeepSeek в сотрудниках?

Наткнулись на интервью с основателем DeepSeek — Лян Веньфэном. В интервью основатель поделился мнением касательно AGI, о том почему компания фокусируется только на исследованиях. Мы сделали небольшую выжимку и оставили только самые любопытные ответы на вопросы о том, что ценит DeepSeek в сотрудниках и на что опирается компания при создании своих моделей.

💬 Многие крупные компании ИИ стремятся нанимать таланты из-за рубежа. Некоторые считают, что 50 лучших талантов ИИ в мире вряд ли будут работать в китайских компаниях. Откуда ваша команда?
V2 был создан исключительно отечественными талантами. Сегодня топ-50 мирового уровня, возможно, не находится в Китае, но мы стремимся развивать свой собственный.


💬Такое свободное управление компанией опирается на найм целеустремленных людей. Говорят, что DeepSeek преуспевает в выявлении исключительных талантов на основе нетрадиционных критериев.
Наши стандарты найма всегда основывались на страсти и любопытстве. Многие из членов нашей команды имеют уникальный и интересный бэкграунд. Их жажда исследований значительно перевешивает финансовый аспект.


💬 Как вы думаете, сколько времени потребуется для достижения AGI? До V2 вы выпустили код/математические модели и перешли к MoE. Каков ваш план?
Это может занять два года, пять лет или десять лет, но это произойдет в течение нашей жизни. Что касается нашего плана, то даже внутри нашей компании нет единого мнения. Однако мы делаем ставку на три направления:
1️⃣ Математика и код, которые служат естественным испытательным полигоном для AGI — подобно Go, они представляют собой замкнутые, проверяемые системы, в которых самообучение может привести к высокому уровню интеллекта.
2️⃣ Мультимодальность, когда ИИ взаимодействует с реальным миром для обучения.
3️⃣ Естественный язык, который является основой человеческого интеллекта.


Полный текст интервью
Please open Telegram to view this post
VIEW IN TELEGRAM
17
Кем я себя ощущаю, когда вижу хорошие метрики у модели:
65
Подборка открытых вакансий 🔵

Исследователь Data Scientist в Сбер
Офис / Гибрид в Москве

Junior/Middle Data analyst в Мегафон
Офис / Гибрид в Москве

Middle Data Scientist в Wildberries
Удаленно / Офис / Гибрид в Москве

Middle Data Scientist LLM/NLP в Самокат
Удаленно / Офис / Гибрид

Middle/Senior MLOps-инженер в Т-Банк
Удаленно / Офис / Гибрид

Senior NLP Engineer в VK Team
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
8
Процесс технического собеседования в ML

Обычно процесс найма занимает от 3 сессий в зависимости от компании. И одной из основных является техническое интервью.

Его могут поделить на несколько частей 😭, но основа такого интервью — это посмотреть, что умеет и знает кандидат.

Теоретическое интервью. Это интервью можно разделить на два типа:

1️⃣ Вопросы по теории: знания статистики, работы алгоритмов или других аспектов (оптимизаторы, батч нормализация, архитектуры). Здесь вопросов очень много и обычно они в стиле "что нужно сделать, чтобы деревья решений не переобучались?" или "зачем делать поправку на смещение в оптимизаторе Адам?". То есть вопросы не просто на знание теории, а на умение рассуждать.

2️⃣ Второй тип отличается тем, что рекрутер просит рассказать вас о собственном опыте. И на основе вашего ответа задает вопрос о том, что можно сделать в модели лучше, или рекрутер спрашивает о том, как вы собирали/очищали данные. Здесь принцип не отличается от первого типа: смотрят что вы уже знаете и как умеете рассуждать.

Совет: заранее узнайте, чем вы будете заниматься на выбранной должности и выберите проект, который лучше всего будет подходить вакансии. При этом подумайте о том, что и как можно улучшить. А также запишите все трудности, с которыми вы столкнулись и почему их не удалось решить.

Помимо теории, вас могут попросить решить пару задач: присылают тестовое и вы его решаете в течение пары дней; присылают ссылку, где вы на сайте решаете несколько задач на время или в режиме реального времени вы решаете задачу под присмотром рекрутера. Вне зависимости от процесса собеседования, задачи можно разделить на следующие:

1️⃣ LeetCode — необходимо решить пару стандартных задач по алгоритмам/структурам данных. В случае ML это обычно работа с тензорами или матричными операциями.

2️⃣ML+оптимизация. На таких собеседованиях могут попросить реализовать одну из концепций ML с нуля. Например, это могут быть различные классические ML-алгоритмы (регрессия, SVM), backpropagation или batch norm.

3️⃣Ядра/распараллеливание. Такие интервью встречаются у тех, кто непосредственно работает с оборудованием (интервью почти всегда на С/С++). Примеры задач, которые могут встретиться: реализовать параллельные вычисления, оптимизировать тензорные операции на уровне ядра. Знание CUDA в этом случае может стать приятным бонусом.

4️⃣ООП. Иногда встречаются и задания, связанные с объектно-ориентированным программированием, обычно это задачи/вопросы про полиморфизм, наследование и т.д.

Совет: прежде чем вам назначат техническое интервью, попросите у рекрутера материалы для подготовки и узнайте, как устроен процесс найма. Обычно в компаниях заранее можно узнать процедуру найма, например, в Яндексе, ТБанке или Ozon.

Ресурсы:
Бесплатная книга для подготовки к собеседованиям "Introduction to Machine Learning Interviews Book".
Потренироваться в решении задач, это что-то вроде LeetCode для млщиков.
Почитать об опыте прохождения собеседований можно здесь, здесь, вот здесь и еще здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
20
2025/08/25 19:25:54
Back to Top
HTML Embed Code: