Forwarded from Navio
Оффер за один день в Navio
One Day Offer — уникальное онлайн-мероприятие, где можно пройти все технические этапы и получить оффер всего за один день.
Кого ищем:
Deep Learning Engineer c опытом разработки сложных нейросетевых решений для production-задач от 3 лет и умением писать качественный код на Python.
Процесс:
Оставьте заявку до 10.09 — получите приглашение до 11.09 — приходите на мероприятие 13.09!
Что нужно делать:
- Разрабатывать и обучать Vision-Language Models (VLM) для задач автономного вождения.
- Создавать и оптимизировать модели представления 3D-сцен, таких, как NeRF и Gaussian Splatting.
- Обучать нейронные сети для задач распознавания объектов на автомобилях-автоматах.
- Анализировать, выдвигать гипотезы, работать с данными и архитектурой моделей и многое другое.
Условия:
- Ежедневная компенсация питания.
- ДМС с первого дня. Стоматология — после испытательного срока.
- Курсы и другие формы внешнего обучение для роста компетенций.
- Подписка на медиасервисы и широкий список дисконт-программ от партнеров.
- Субсидия на ипотеку и продукты банка-партнера на выгодных условиях.
Регистрация и отклик по ссылке: https://vk.cc/cP8LFm?erid=2W5zFH4oUSk
One Day Offer — уникальное онлайн-мероприятие, где можно пройти все технические этапы и получить оффер всего за один день.
Кого ищем:
Deep Learning Engineer c опытом разработки сложных нейросетевых решений для production-задач от 3 лет и умением писать качественный код на Python.
Процесс:
Оставьте заявку до 10.09 — получите приглашение до 11.09 — приходите на мероприятие 13.09!
Что нужно делать:
- Разрабатывать и обучать Vision-Language Models (VLM) для задач автономного вождения.
- Создавать и оптимизировать модели представления 3D-сцен, таких, как NeRF и Gaussian Splatting.
- Обучать нейронные сети для задач распознавания объектов на автомобилях-автоматах.
- Анализировать, выдвигать гипотезы, работать с данными и архитектурой моделей и многое другое.
Условия:
- Ежедневная компенсация питания.
- ДМС с первого дня. Стоматология — после испытательного срока.
- Курсы и другие формы внешнего обучение для роста компетенций.
- Подписка на медиасервисы и широкий список дисконт-программ от партнеров.
- Субсидия на ипотеку и продукты банка-партнера на выгодных условиях.
Регистрация и отклик по ссылке: https://vk.cc/cP8LFm?erid=2W5zFH4oUSk
Please open Telegram to view this post
VIEW IN TELEGRAM
❤49
Data Analyst в Beeline
Удаленно
Предстоит: Анализ бизнес-данных из различных источников, включая работу с иерархическими справочниками и построение измерений; Разработка и оптимизация SQL-запросов для аналитики, агрегаций и бизнес-метрик; Разработка и поддержание дашбордов…. Узнать подробнее🔵
Удаленно
Предстоит: Анализ бизнес-данных из различных источников, включая работу с иерархическими справочниками и построение измерений; Разработка и оптимизация SQL-запросов для аналитики, агрегаций и бизнес-метрик; Разработка и поддержание дашбордов…. Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Media is too big
VIEW IN TELEGRAM
Наткнулись тут на интервью, в котором Дженсен Хуанг рассказывает о том, как устроена работа в его компании и о мотивации.
Что касается мотивации. Хуанг считает, что лучшая мотивация для сотрудника — личный пример. То как вы реагируете на удачи или плохие результаты, что для вас важно и не важно? Такими вопросами задается Дженсен Хуанг днями напролет.
«В моём прямом подчинении 55 человек. Я не пишу оцениваю их эффективность, а даю им постоянную обратную связь, и они делают то же самое для меня… Многие из наших топ-менеджеров получают одинаковую зарплату — вплоть до доллара. И я не провожу с ними индивидуальные встречи, если только они сами в этом не нуждаются. В таком случае я отброшу все дела ради них. У меня никогда не бывает встреч с ними наедине, и они никогда не слышат от меня ничего, что предназначено только для их ушей. Нет ни единого фрагмента информации, который я бы по секрету сообщил «исполнительному составу» и не рассказал бы всей остальной компании. Таким образом, наша компания создана для маневренности, для максимально быстрого потока информации, для того, чтобы люди были воодушевлены тем, что они делают, — а не тем, что они знают».
Что касается мотивации. Хуанг считает, что лучшая мотивация для сотрудника — личный пример. То как вы реагируете на удачи или плохие результаты, что для вас важно и не важно? Такими вопросами задается Дженсен Хуанг днями напролет.
❤26
⚡️ ClickHouse vs Greenplum: что выбрать для аналитики?
📅 10 сентября | 20:00 мск | бесплатно
✅ На вебинаре разберёмся, какая СУБД лучше подойдёт для ваших задач:
• Архитектура, производительность и масштабируемость CH и Greenplum
• Различия в хранении и обработке данных
• Как базы показывают себя в OLAP, ETL и ad-hoc аналитике
• Реальные кейсы внедрения и оптимизации
✅ После урока вы сможете:
• Выбирать оптимальное решение под разные сценарии
• Оценивать производительность и удобство работы
• Понимать архитектурные плюсы и минусы каждой СУБД
💥 Участие бесплатное — регистрируйтесь и приходите:
https://clck.ru/3P2QMA
Бесплатное занятие приурочено к старту курса ClickHouse. После обучения вы научитесь быстро и эффективно настраивать БД, работать с ее продвинутыми функциями, интегрировать с другими системами и выбирать оптимальные решения для ваших данных.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
📅 10 сентября | 20:00 мск | бесплатно
✅ На вебинаре разберёмся, какая СУБД лучше подойдёт для ваших задач:
• Архитектура, производительность и масштабируемость CH и Greenplum
• Различия в хранении и обработке данных
• Как базы показывают себя в OLAP, ETL и ad-hoc аналитике
• Реальные кейсы внедрения и оптимизации
✅ После урока вы сможете:
• Выбирать оптимальное решение под разные сценарии
• Оценивать производительность и удобство работы
• Понимать архитектурные плюсы и минусы каждой СУБД
💥 Участие бесплатное — регистрируйтесь и приходите:
https://clck.ru/3P2QMA
Бесплатное занятие приурочено к старту курса ClickHouse. После обучения вы научитесь быстро и эффективно настраивать БД, работать с ее продвинутыми функциями, интегрировать с другими системами и выбирать оптимальные решения для ваших данных.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576
❤1
Senior Applied Research Scientist in Nvidia
Office
What To Do: Working with our team of researchers to develop efficient and performant models and pipelines that extract text content from images, video, audio and other modalities; Building vision pipelines for document ingestion, including page layout analysis, object detection, and OCR..... find out more🔵
Office
What To Do: Working with our team of researchers to develop efficient and performant models and pipelines that extract text content from images, video, audio and other modalities; Building vision pipelines for document ingestion, including page layout analysis, object detection, and OCR..... find out more
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8
Отличный ресурс для подготовки к интервью
Репозиторий составил ML-инженер, который проходил собеседования в крупные tech-компании, такие как Google, Meta или Apple. Он выделил общие этапы всех собеседований и добавил ресурсы для подготовки, кратко об основных этапах:
1️⃣ этап — общее программирование. В зависимости от компании, у вас может быть 1-2 раунда по разработке ПО. Обычно это задачи в стиле Leetcode, но автор репозитория также рекомендует ознакомиться с educative.io, где опубликованы полезные курсы для подготовки, а также с Exponent — это тоже онлайн-платформа с курсами, но её отличием являются мок-сессии для тренировки прохождения собеседований.
2️⃣ этап — ML-интервью.
В зависимости от компании этот этап могут пропустить. Из личного опыта автора: на таком собеседовании могут встретиться вопросы про регрессию, алгоритм k-средних, деревья решений, CNN, RNN, TF-IDF и другие базовые темы.
3️⃣ этап — ML System Design.
Этот этап отличается тем, что на большинство вопросов нет правильного ответа. Цель такого собеседования — оценить вашу способность масштабировать и проектировать ML-систему для производства.
4️⃣ этап — агентные системы.
Agentic AI — стильно, модно, молодежно, поэтому рекрутеры активно нанимают специалистов со знанием агентного ИИ. Чтобы не отставать от текущей практики — начинаем знакомиться м основами здесь.
5️⃣ этап — поведенческое интервью.
Чаще всего оценка этого интервью осуществляется по методике STAR. Среди распространённых вопросов: «Почему вы хотите здесь работать?», «Как вы управляете проектами в условиях давления?», «Расскажите о случае, когда вы совершили ошибку» и т.д.
Репозиторий составил ML-инженер, который проходил собеседования в крупные tech-компании, такие как Google, Meta или Apple. Он выделил общие этапы всех собеседований и добавил ресурсы для подготовки, кратко об основных этапах:
В зависимости от компании этот этап могут пропустить. Из личного опыта автора: на таком собеседовании могут встретиться вопросы про регрессию, алгоритм k-средних, деревья решений, CNN, RNN, TF-IDF и другие базовые темы.
Этот этап отличается тем, что на большинство вопросов нет правильного ответа. Цель такого собеседования — оценить вашу способность масштабировать и проектировать ML-систему для производства.
Agentic AI — стильно, модно, молодежно, поэтому рекрутеры активно нанимают специалистов со знанием агентного ИИ. Чтобы не отставать от текущей практики — начинаем знакомиться м основами здесь.
Чаще всего оценка этого интервью осуществляется по методике STAR. Среди распространённых вопросов: «Почему вы хотите здесь работать?», «Как вы управляете проектами в условиях давления?», «Расскажите о случае, когда вы совершили ошибку» и т.д.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6
Первый раз в первый X5 Tech-класс!
Школьники бегут за парты, а X5 Tech открывает набор в уникальный IT-класс для студентов. Здесь можно проверить свои скилы в кодерских задачах, получить звездочки в IT-дневник и забрать крутые призы. Покажи всему классу, на что способен!
Что ждет участников:
— задачи по backend-, frontend-, мобильной разработке, Data Science, DevOps-инфраструктуре и аналитике данных;
— ценные призы: проходки на экскурсию в распределительный центр для москвичей, подарочные карты в Пятёрочку и другие подарки от X5 Tech;
— сбор звездочек в IT-дневник и карьерные гайды;
— задания в формате квеста.
Первый звонок в X5 Tech-классе уже прозвенел! Записывай первую домашку — изучить расписание предметов по ссылке.
Школьники бегут за парты, а X5 Tech открывает набор в уникальный IT-класс для студентов. Здесь можно проверить свои скилы в кодерских задачах, получить звездочки в IT-дневник и забрать крутые призы. Покажи всему классу, на что способен!
Что ждет участников:
— задачи по backend-, frontend-, мобильной разработке, Data Science, DevOps-инфраструктуре и аналитике данных;
— ценные призы: проходки на экскурсию в распределительный центр для москвичей, подарочные карты в Пятёрочку и другие подарки от X5 Tech;
— сбор звездочек в IT-дневник и карьерные гайды;
— задания в формате квеста.
Первый звонок в X5 Tech-классе уже прозвенел! Записывай первую домашку — изучить расписание предметов по ссылке.
❤2
Подборка открытых вакансий 🔵
Ведущий специалист Data Science в МТС
Офис в Москве
Middle Data Engineer в СовкомБанк
Офис в Казани и Санкт-Петербурге
Senior Data Scientist в ЦИАН
Удаленно / Гибрид / Офис в Москве, Санкт-Петербурге, Новосибирске
Middle/Senior Data Analyst в Wildberries
Гибрид / Офис в Москве
Middle/Senior Data Analyst в Beeline
Удаленно
Senior Data Engineer в 2GIS
Удаленно
Data Scientist в Авито
Удаленно / Гибрид / Офис в Москве
Ведущий специалист Data Science в МТС
Офис в Москве
Middle Data Engineer в СовкомБанк
Офис в Казани и Санкт-Петербурге
Senior Data Scientist в ЦИАН
Удаленно / Гибрид / Офис в Москве, Санкт-Петербурге, Новосибирске
Middle/Senior Data Analyst в Wildberries
Гибрид / Офис в Москве
Middle/Senior Data Analyst в Beeline
Удаленно
Senior Data Engineer в 2GIS
Удаленно
Data Scientist в Авито
Удаленно / Гибрид / Офис в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Неожиданно: OpenAI анонсирует платформу найма на базе ИИ
По словам представителя, сервис получит название OpenAI Jobs Platform и позволит компании составить серьёзную конкуренцию LinkedIn. Запуск платформы запланирован на середину 2026 года.
Гендиректор OpenAI Applications Фиджи Симо объявил о новом проекте в четверг, заявив, что компания «будет использовать ИИ, чтобы находить идеальное соответствие между потребностями компаний и возможностями соискателей».
Примечательно, что эта платформа может сделать OpenAI прямым конкурентом LinkedIn, соучредителем которой является Рид Хоффман — один из первых инвесторов OpenAI. При этом LinkedIn принадлежит Microsoft, крупнейшему инвестору OpenAI🤷♂️
По словам представителя, сервис получит название OpenAI Jobs Platform и позволит компании составить серьёзную конкуренцию LinkedIn. Запуск платформы запланирован на середину 2026 года.
Гендиректор OpenAI Applications Фиджи Симо объявил о новом проекте в четверг, заявив, что компания «будет использовать ИИ, чтобы находить идеальное соответствие между потребностями компаний и возможностями соискателей».
Примечательно, что эта платформа может сделать OpenAI прямым конкурентом LinkedIn, соучредителем которой является Рид Хоффман — один из первых инвесторов OpenAI. При этом LinkedIn принадлежит Microsoft, крупнейшему инвестору OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14
Валютная удалёнка – мечта или реальность?
Работать из РФ и получать зп в долларах – кто об этом не мечтал! Но выглядит это слишком тяжело и нереалистично. Сразу возникает куча вопросов:
⭐️ Как податься в иностранную компанию?
⭐️ В чем отличия в процессе собеседования?
⭐️ К каким вопросам и задачам готовиться?
В зарубежных компаниях (без топ менеджмента из выходцев из Восточной Европы) всё может быть совсем иначе — начиная с формата резюме и заканчивая этапами интервью.
Если эта тема вам актуальна, рекомендую полезный ресурс, который ведёт Иван Анисимов. У него большой опыт поиска работы и релокации в IT и он разбирает типичные ошибки кандидатов, которые мешают пройти отбор.
В чате:
– Общение с единомышленниками, которые тоже ищут работу за рубежом
– Ответы на частые вопросы — от поиска вакансий до нюансов оформления
– Бесплатные консультации по резюме и гайды, чтобы не тратить недели на сбор информации
Формат дружелюбный — можно просто читать, можно задавать вопросы или помогать другим. Для желающих выйти на зарубежный IT-рынок — отличная точка старта.
Если вам актуально, подписывайтесь🌸
Реклама. Erid: 2VtuoPt7ys
Работать из РФ и получать зп в долларах – кто об этом не мечтал! Но выглядит это слишком тяжело и нереалистично. Сразу возникает куча вопросов:
В зарубежных компаниях (без топ менеджмента из выходцев из Восточной Европы) всё может быть совсем иначе — начиная с формата резюме и заканчивая этапами интервью.
Если эта тема вам актуальна, рекомендую полезный ресурс, который ведёт Иван Анисимов. У него большой опыт поиска работы и релокации в IT и он разбирает типичные ошибки кандидатов, которые мешают пройти отбор.
В чате:
– Общение с единомышленниками, которые тоже ищут работу за рубежом
– Ответы на частые вопросы — от поиска вакансий до нюансов оформления
– Бесплатные консультации по резюме и гайды, чтобы не тратить недели на сбор информации
Формат дружелюбный — можно просто читать, можно задавать вопросы или помогать другим. Для желающих выйти на зарубежный IT-рынок — отличная точка старта.
Если вам актуально, подписывайтесь
Реклама. Erid: 2VtuoPt7ys
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Собеседование на позицию Senior ML-инженера
Нашли тут историю одного инженера, который собеседовался в FAANG: первое, что он сделал, чтобы получить работу — схитрил в своем профиле LinkedIn. Он указал, что проживает в Лондоне (хотя на самом деле находился в другой стране), и немного подкорректировал свой недавний опыт. Внезапно ему начали приходить приглашения на собеседования. Инженер даже начал ощущать себя обманщиком, так как ему приходили отклики на позиции ведущего или старшего ML-инженера. Но самое интересное, что он обнаружил: вопросы на ML-Engineer и Senior ML-Engineer примерно одинаковые. Удивительно, правда?👀
Также автор истории заметил, что на руководящих должностях часто акцент делается на гибких навыках: как кандидат справляется с неудачами, конфликтами в команде, взаимодействует с другими подразделениями и т.д.
Что касается самого процесса собеседования: технические интервью в стиле LeetCode для сеньерской позиции почти ничем не отличались от вопросов на должность ML-инженера. Задания, которые даются на дом, также оказались не сложнее, чем для рядового инженера. То же самое наблюдалось и с другими типами интервью, кроме поведенческого: для сеньерской позиции компании сосредотачивались на неудачах, управлении конфликтами и межкомандном сотрудничестве.
Существенная разница в технических собеседованиях была у Research Engineer. Там кандидата спрашивают, например, как JPEG сжимает изображения? Как вычислить n-ное число Фибоначчи за O(log n)? Зачастую на такой должности требуют решать много задач типа «преобразовать математические данные в код» или «разбить на части и улучшить».
Для себя автор выделил общий ход собеседований:
1️⃣ этап — разговор с рекрутером, на котором вы обсуждаете резюме, ваши знания о компании и причину, почему вы хотите там работать.
Предупреждение: даже на этом этапе существует вероятность отказа. Например, если рекрутер сочтет, что вам не интересна эта должность или ваши карьерные планы не соответствуют обязанностям.
2️⃣ этап — техническое интервью. Его могут разделить на 2 части: задание на дом с последующим обсуждением или live-кодирование по ML.
3️⃣ этап — тоже техническое интервью, но уже посвященное системному проектированию.
❗ На втором и третьем этапах важно сосредоточиться на качестве, а не на количестве. Хороший способ продемонстрировать профессионализм — задать уточняющие вопросы после получения задания. И внимательно его прочитать. Слишком часто люди все делают неправильно и даже не проверяют ограничения.
4️⃣ этап — поведенческое интервью.
Этот этап обычно предназначен для всего, что не было охвачено ранее. Некоторые компании проводят три этапа, объединяя третий и четвертый.
Нашли тут историю одного инженера, который собеседовался в FAANG: первое, что он сделал, чтобы получить работу — схитрил в своем профиле LinkedIn. Он указал, что проживает в Лондоне (хотя на самом деле находился в другой стране), и немного подкорректировал свой недавний опыт. Внезапно ему начали приходить приглашения на собеседования. Инженер даже начал ощущать себя обманщиком, так как ему приходили отклики на позиции ведущего или старшего ML-инженера. Но самое интересное, что он обнаружил: вопросы на ML-Engineer и Senior ML-Engineer примерно одинаковые. Удивительно, правда?
Также автор истории заметил, что на руководящих должностях часто акцент делается на гибких навыках: как кандидат справляется с неудачами, конфликтами в команде, взаимодействует с другими подразделениями и т.д.
Что касается самого процесса собеседования: технические интервью в стиле LeetCode для сеньерской позиции почти ничем не отличались от вопросов на должность ML-инженера. Задания, которые даются на дом, также оказались не сложнее, чем для рядового инженера. То же самое наблюдалось и с другими типами интервью, кроме поведенческого: для сеньерской позиции компании сосредотачивались на неудачах, управлении конфликтами и межкомандном сотрудничестве.
Существенная разница в технических собеседованиях была у Research Engineer. Там кандидата спрашивают, например, как JPEG сжимает изображения? Как вычислить n-ное число Фибоначчи за O(log n)? Зачастую на такой должности требуют решать много задач типа «преобразовать математические данные в код» или «разбить на части и улучшить».
Для себя автор выделил общий ход собеседований:
Предупреждение: даже на этом этапе существует вероятность отказа. Например, если рекрутер сочтет, что вам не интересна эта должность или ваши карьерные планы не соответствуют обязанностям.
Этот этап обычно предназначен для всего, что не было охвачено ранее. Некоторые компании проводят три этапа, объединяя третий и четвертый.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤20
🚀 Phystech.Genesis зовёт тебя в экспедицию!
Проверь навыки на реальных данных: разработай ПО для поиска объектов в рельефе по данным аэрофотосъёмки, спутниковых снимков и лазерного сканирования.
Почему стоит участвовать?
• Работа над социально значимой задачей — технологии, которые помогут археологам.
• Сообщество специалистов: знакомство с компаниями и экспертами CV/ML.
🔥 Призовой фонд - 5 000 000 ₽.
Кого ждем?
💻 Команды 2-5 человек уровня Middle и выше в области ML/CV.
📌 Формат: онлайн на DS-платформе Phystech.Genesis.
Участвовать могут как физические лица, так и компании.
⏳ Подай заявку до 14 октября по ссылке.
Проверь навыки на реальных данных: разработай ПО для поиска объектов в рельефе по данным аэрофотосъёмки, спутниковых снимков и лазерного сканирования.
Почему стоит участвовать?
• Работа над социально значимой задачей — технологии, которые помогут археологам.
• Сообщество специалистов: знакомство с компаниями и экспертами CV/ML.
🔥 Призовой фонд - 5 000 000 ₽.
Кого ждем?
💻 Команды 2-5 человек уровня Middle и выше в области ML/CV.
📌 Формат: онлайн на DS-платформе Phystech.Genesis.
Участвовать могут как физические лица, так и компании.
⏳ Подай заявку до 14 октября по ссылке.
Подборка открытых вакансий 🔵
Junior Data аналитик в Сбер
Офис в Москве
Middle Data Scientist (NLP) в Bia Technologies
Удаленно / Офис / Гибрид в Санкт-Петербурге, Омске, Владимире, Тамбове
Middle MLOps Engineer в Positive Technology
Удаленно / Офис / Гибрид в Москве, Нижнем Новгороде, Самаре, Новосибирске, Санкт-Петербурге, Томске
Senior Data Engineer в Спортмастер
Удаленно / Офис / Гибрид в Москве
Middle/Senior ML Analyst в Kaspersky
Офис / Гибрид в Москве
Middle/Senior Data Scientist в Альфа Банк
Офис / Гибрид в Москве
Middle Data Engineer в Яндекс
Офис / Гибрид
Middle ML Engineer в VK Team
Офис / Гибрид в Москве
Junior Data аналитик в Сбер
Офис в Москве
Middle Data Scientist (NLP) в Bia Technologies
Удаленно / Офис / Гибрид в Санкт-Петербурге, Омске, Владимире, Тамбове
Middle MLOps Engineer в Positive Technology
Удаленно / Офис / Гибрид в Москве, Нижнем Новгороде, Самаре, Новосибирске, Санкт-Петербурге, Томске
Senior Data Engineer в Спортмастер
Удаленно / Офис / Гибрид в Москве
Middle/Senior ML Analyst в Kaspersky
Офис / Гибрид в Москве
Middle/Senior Data Scientist в Альфа Банк
Офис / Гибрид в Москве
Middle Data Engineer в Яндекс
Офис / Гибрид
Middle ML Engineer в VK Team
Офис / Гибрид в Москве
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Разбор вопроса с собеседования: Как объяснить ситуацию, когда у модели высокий ROC-AUC, но низкий PR-AUC? Какой показатель надежнее на несбалансированных данных и почему?
Разбираемся со всем по порядку:
ROC-AUC показывает, насколько хорошо модель ранжирует объекты — то есть отделяет положительные примеры от отрицательных в целом. Сравнивает True Positive Rate с False Positive Rate.
PR-AUC фокусируется только на положительном классе. Его интересует, сколько из предсказанных положительных примеров действительно верны (precision) и насколько модель полная (recall).
Так как выборка не сбалансирована, то высокий ROC-AUC может сохраняться потому, что даже при большом числе ложноположительных срабатываний False Positive Rate может оставаться низким. Это происходит из-за огромного количества истинно отрицательных примеров в знаменателе формулы FPR = FP / (FP + TN).
Низкий PR-AUC возникает потому, что Precision резко падает даже при небольшом количестве ложноположительных срабатываний, если истинно положительных примеров очень мало. В формуле Precision = TP / (TP + FP) знаменатель сильно страдает от любых FP.
Так какой показатель надежнее?
В несбалансированных задачах лучше отдавать предпочтение PR-AUC. Он лучше отражает реальную эффективность модели, так как сфокусирован на качестве предсказания редкого положительного класса и критичен к ложным срабатываниям, а ROC-AUC полезен для оценки общей ранжирующей способности модели.
Разбираемся со всем по порядку:
ROC-AUC показывает, насколько хорошо модель ранжирует объекты — то есть отделяет положительные примеры от отрицательных в целом. Сравнивает True Positive Rate с False Positive Rate.
PR-AUC фокусируется только на положительном классе. Его интересует, сколько из предсказанных положительных примеров действительно верны (precision) и насколько модель полная (recall).
Так как выборка не сбалансирована, то высокий ROC-AUC может сохраняться потому, что даже при большом числе ложноположительных срабатываний False Positive Rate может оставаться низким. Это происходит из-за огромного количества истинно отрицательных примеров в знаменателе формулы FPR = FP / (FP + TN).
Низкий PR-AUC возникает потому, что Precision резко падает даже при небольшом количестве ложноположительных срабатываний, если истинно положительных примеров очень мало. В формуле Precision = TP / (TP + FP) знаменатель сильно страдает от любых FP.
Так какой показатель надежнее?
В несбалансированных задачах лучше отдавать предпочтение PR-AUC. Он лучше отражает реальную эффективность модели, так как сфокусирован на качестве предсказания редкого положительного класса и критичен к ложным срабатываниям, а ROC-AUC полезен для оценки общей ранжирующей способности модели.
❤33
Вы работаете с данными, но хотите более разнообразных задач?
Вам нужно перейти в Data Science. До 15 сентября в Вышке продолжается набор на онлайн-магистратуру «Магистр по наукам о данных». Поступить можно даже без технического бэкграунда, а учиться — в удобном формате. За время обучения вы станете:
⚪️ Data Scientist
⚪️ ML Engineer
Что вы получите, когда поступите?
⚪️ качественное обучение на очной программе в онлайн-формате
⚪️ возможность стать специалистом в области DS без бэкграунда
⚪️ отсрочка от армии, льготный проезд и другие студенческие привилегии
⚪️ практические проекты, которые можно сразу включить в портфолио
⚪️ диплом государственного образца очной магистратуры.
Во время обучения студенты выходят на позиции Junior DS и Junior ML Engineer или идут по академическому пути.
📕 Узнать больше о поступлении
А чтобы узнать, как подать документы, вступайте в чат абитуриентов — там найдете инструкции и сможете получить ответы на любые вопросы о программе.
Вам нужно перейти в Data Science. До 15 сентября в Вышке продолжается набор на онлайн-магистратуру «Магистр по наукам о данных». Поступить можно даже без технического бэкграунда, а учиться — в удобном формате. За время обучения вы станете:
Что вы получите, когда поступите?
Во время обучения студенты выходят на позиции Junior DS и Junior ML Engineer или идут по академическому пути.
А чтобы узнать, как подать документы, вступайте в чат абитуриентов — там найдете инструкции и сможете получить ответы на любые вопросы о программе.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Data Scientist / ML-инженер в НМГ
Предстоит: создание моделей для задач NLP и CV; доработка и улучшение существующих моделей; анализ данных из социальных сетей: классификация, кластеризация, определение сущностей, выявление аномалий…. Узнать подробнее🔵
Предстоит: создание моделей для задач NLP и CV; доработка и улучшение существующих моделей; анализ данных из социальных сетей: классификация, кластеризация, определение сущностей, выявление аномалий…. Узнать подробнее
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4
Исследование Fastly показало, что опытные разработчики чаще используют ИИ для генерации кода
В опросе участвовал 791 разработчик, почти треть из которых с опытом более 10 лет. Оказалось, что более половины кода у сеньер-разработчиков написан с помощью ИИ. Этот показатель более чем вдвое превышает результат джунов (с опытом до двух лет): среди них об этом сообщили лишь 13%.
При этом 28% респондентов признались, что часто тратят столько времени на исправление ИИ-кода, что преимущества ИИ сводятся на нет. Ещё 14% заявили, что редко вносят существенные правки.
Тем не менее, более половины участников отметили, что ИИ-инструменты (включая GitHub Copilot, Google Gemini и Anthropic Claude) помогают им работать быстрее. Старшие инженеры проявили больший энтузиазм: 59% из них констатировали рост скорости работы против 49% среди младших коллег.
В опросе участвовал 791 разработчик, почти треть из которых с опытом более 10 лет. Оказалось, что более половины кода у сеньер-разработчиков написан с помощью ИИ. Этот показатель более чем вдвое превышает результат джунов (с опытом до двух лет): среди них об этом сообщили лишь 13%.
При этом 28% респондентов признались, что часто тратят столько времени на исправление ИИ-кода, что преимущества ИИ сводятся на нет. Ещё 14% заявили, что редко вносят существенные правки.
Тем не менее, более половины участников отметили, что ИИ-инструменты (включая GitHub Copilot, Google Gemini и Anthropic Claude) помогают им работать быстрее. Старшие инженеры проявили больший энтузиазм: 59% из них констатировали рост скорости работы против 49% среди младших коллег.
❤7