Telegram Group Search
(2/2)
И необходимость такой структуры – такой же закон физики как невозможность встать со стула, не подавшись корпусом вперед – попробуйте, кстати.

Отсюда следует вывод 2: кому-то в компании тоже должен быть нужен ваш рост, не только вам

И этим кем-то может выступать не только матричный руководитель, но и CPO / PO!
Когда такое бывает? Когда его продукт растет и внутри выделяются продукты помельче, туда надо нанимать команды, и это ваш шанс вырасти из синьора в лида и из тимлида в руководителя направления (CDO, например) или заняться RnD для такого крупного продукта.

Вывод 3: выбирать продукт относясь к нему как к инвестиции собственного времени, – выбирать тот, который вырастет, где возможно открытие новых бизнес-линий.

И вот этот способ (расти вместе с правильно выбранным продуктом) самый простой – прилив поднимает все лодки.

Остальные потребуют либо смену продукта – а это не очень-то и отличается от смены работы, либо вовлечение матричных руководителей и целеполагание уже от них (а с двумя руководителями работать сложнее чем с одним).

Здесь кому что нравится – кому-то нравится в продукте сидеть, мне нравится проектная работа с понятным результатом в понятный срок.
This media is not supported in your browser
VIEW IN TELEGRAM
Сотрудница поделилась секретной техникой, которая способна убрать все правки и лишние задачи от твоего босса вмиг.

Пользуемся.
В комментариях к этому посту попросили поделиться ссылками на антифрод, их есть у меня

Прям в цельную картинку вместе они собраны в курсе ML в бизнесе, но здесь поделюсь кусочками, из которых она состоит.

А для совсем начинающих – хендбук

Как вообще устроен антифрод (на примере фин. мониторинга):

1. Правила (известные схемы, например из профильных обнальных тг-чатов -- для обнала: распыление, слом назначения платежа, вексели, слом ндс, транзит и пр) и экспертные модели (регрессии на известных фичах -- доли контрагентов, коэффициента налоговой нагрузки, корп карты, учредитель - подставное лицо и пр.). Известные фичи "ломаются" уже со стороны нарушителя -- например, КНН можно увеличить отправляя ошибочные платежки в налоговую и получая возвраты

2. Модели (supervised модели, построенные по отловленным правилами и руками кейсам). Здесь тоже работает PseudoLabelling. Но и фродеры не стоят на месте, на это намекал в самом первом посте

3. Кейс-менеджмент и эксперты (разбор найденных примеров, новых схем, мотивированное суждение). Разбор кейса может занимать, например, 2 недели, включая запрос документов от клиента

4. Exploration -- unsupervised -- outlier detection -- наша задача найти несколько десятков примеров, передать их на разбор, сделать supervised модель

5. Мониторинг качества работы и схем и отдельных фичей, симуляции новых схем атак
Мониторинг мошеннических заявок на кредит, определение компаний, искажающих финансовую отчетность -- все это тоже про антифрод.
На Forex вообще фродовыми считаются клиенты, которые выживают и выводят деньги.

Таргетом может быть как компания / физик так и конкретная сомнительная транзакция.

Итак, сами материалы

Поиск аномалий в табличках (для того чтобы быстро разные алгоритмы перебрать):
1. PYOD – база, даже вариационный автоэнкодер включили (вообще автоэкнодеры в разных формах полезны в этих задачах)
2. PYTOD – ускоренная версия (за счет использования GPU) – вообще большинство классических алгоритмов редко применяют из-за того что они очень медленные, мне нравится Isolation Forest из всех, но перебирать всегда приходится несколько
Здесь важно сделать отступление – что для многих классических алгоритмов придется как-то умозрительно задать ожидаемую долю аномалий, что не очень удобно. По факту нам интереснее ранжирование на более аномальные и менее – а дальше сколько мы возьмем будет зависеть от цены ошибки в каждом кейсе и мощности офицеров чтобы эти кейсы руками разобрать и подтвердить.

Поиск аномалий на транзакциях:
1. PYGOD– смотрим на задачу как на поиск аномалий в графах (и то, насколько аномалия должна быть более структурной чем контекстной – необучаемый параметр в лоссе), здесь в основном графовые автоэнкодеры
Но это прям затравочка, тема популярная, плюс графы меняются по времени (и структура и свойства вершин / ребер), даже на последнем NIPS (а это декабрь) показали новый алгоритм поиска аномалий на графах UniGAD. И еще на KDD’24 (сам еще не успел прочесть читал, но denoising диффузионка звучит как что-то интересное)

Подборка актуальных статей по теме

2. PTLS от Sber AI лабы сначала ssl-эмбеддим транзакции, потом закидываем в табличные методы

Если уже нашли и даже добились какой-то разметки, но единичек не очень много сотни), то помогает pseudolabelling– строите график того как метрика (обычно recall) зависит от того, с какого порога предикты единичек первой моделью досыпать в трейн второй. Выбираете порог, максимизирующий recall -- не панацея конечно, но до +10% полноты получалось выжимать.

Ну и supervised – здесь относительно понятно, кроме того на какой event rate калиброваться, да и надо ли )
Кейс про два стула для кластер-лида

Вызывает как-то шеф к себе — говорит:
«
— Надо сделать модель рекомендации кредитной ставки, выбери кто делать будут — К или Ш (два крупных подразделения)
— А чего мы сами не сделаем, фин эффект себе не запишем?
— А я уже им пообещал
— А кому ты пообещал?
— И тем и тем, ты уж как-нибудь разберись и выбери одних 🤡👏»


Мало того что если выбрать кого-то из этих двух структур, другая к тебе повернется отнюдь не лицом и на существенный срок – все из-за дележки фин эффектов. Причем подкузьмить могут недурно обе башни – через Ш вводятся ставки, а через финансистов (братьев К) защищаются эффекты.

Естественно они ни в какую не хотели данными делиться ни с кем — у одних были данные по нормативной валовой марже по отраслям, по кредитным договорам — а у других реальные финансовые потоки, модель досрочного гашения кредита и всякое полезное иное.

Попытка предложить им сделать две модели и объединить результаты тоже была принята в штыки, посыпались звонки шефу от уважаемых вице-президентов.

Ну тогда по заветам известной байки про Шваба с куском мела договариваемся что в пром ставим ту модель где ошибка на тесте меньше. И в срок 2 мес нужны предикты на тестовый период, мол, метрики мы сами насчитаем – для объективности. Каждая команда уходит строить модель на своих данных.

Проходит 4 месяца и команды возвращаются. До конца года осталось не то чтобы сильно много. Снова предлагаю объединить скоры – шум, гам, обозвали волюнтаристом 🤥. Ну ок, у нас есть дисперсия каждой модели на тесте, давайте попробуем хоть на пальцах прикинуть сколько будет A/B идти. Заодно-таки построим самую примитивную общую модель – с весами сложить предикты команд. В чем суть A/B (на самом деле A/B/C): мы рекомендуем ставку кредита клиентщику для переговоров (давая текстовое описание почему она именно такая), если в группе удается маржу хотя бы на 0.1% в среднем поднять то это сотни миллионов дохода, но сравниваемся мы не только с теми, кому рекомендацию модели не показываем, но и с теми, кому показываем рандомные +0.1% – 0.5% накинуть к нормативной марже.

Считаем с поправками, подбираем сиды везде где только можно, и выходим на нужные числа (сработали не хуже Росстата): если модели не объединять (используя нашу в тч) то до конца года не успеем провести тест и защитить эффект.

Пришлось модели все-таки объединить и эффект на три подразделения делить поровну (ага, и мы кусочек получили) 😝. То же не без битвы -- "а давайте по человеко-часам считать", "а давайте пропорционально аплифту к метрике на тесте" и т.д. Но когда в доме пожар, обсуждение чья очередь мыть посуду не то что бы сильно затягивается 🤓

Поэтому как менеджер не верю я в "великих переговорщиков" и достижимость win-win по-джентельменски, на берегу -- если вопрос действительно чувствительный и интерес вполне себе корыстный, то в корпорации скорее закон джунглей действует, а окно для того чтобы договориться по-человечески появится когда уже совсем деваться некуда будет. Важен только момент времени и критичность ситуации.
Интересная в Яндексе в ecom культура — требовать от сотрудников личную телегу показывать, хорошо пока на конюшне барин не порет.

Как он так умудрился выстроить коммуникации с командой, что у каждого десятки непонятных p2p запросов в день вообще неясно. Могу погадать что там нет либо закрепленных зон ответственности, либо документации, либо всего вместе.

В любом случае лезть в личные телефоны сотрудников -- это неадекват
Forwarded from Media Rare
Крик души - почему столько людей позволяют на работе не отвечать другим в тот же день и просто оставлять непрочитанные?

Сталкиваюсь с этим даже в своей команде, когда просишь показать людей телеграмм и там видно, как десятки входящих даже в личку, а не чатах..просто...игнорируются.. А ведь хороший менеджер все равно потом проэскалирует наверх, партнер найдет личный контакт генерального директора, а контрагент еще и позвонит.. И все это потому что кому-то просто было лень за 15 секунд прочитать входящеее и форвраднуть быстро куда следует.

Тут уже делал гайд, как исправиться :) Недавно на встрече прямых по очереди попросил открыть свои телеги и показать unread - в шоке увидел, что половина людей не соблюдает 0inbox >_<

@media_rare
В тему каналий-манагеров и их компетенций.

Если с организационными способностями и операционным управлением все на поверхности – достаточно одного показательного поста, то как насчет других компетенций?

Возьмем крайний случай – “умение разбираться в людях”.
Всегда недоумевал – как за получасовую / часовую встречу сделать хоть сколько-нибудь точный прогноз вроде того будет ли человек вообще работать, надежный ли он, интересно ли ему то, чем он занимается, будет ли он развиваться в этой области и много-много других выводов.

К счастью, я больше не встречаю у HR в заметках после собеседований “лапуля нормис”, но вот длинные трактаты далекоидущими выводами с часовой встречи, на которым был еще и продакт, а hr задала всего пару вопросов – регулярно. И это прям устоявшаяся мировая практика, целые курсы продают как на такие вопросы отвечать. Осенью я даже потратил пару вечеров чтобы запилит англоязычного бота-тренера который сэмплит тебе вопрос (по которому можно подсказку посмотреть), ты голосовым надиктовываешь ответ, а он дает фидбек – что хорошо, что улучшить – а где красные флаги. Если интересно – ставьте палец вверх, скину в одном из следующих постов.


И вот на днях друг и говорит – “А чему ты удивляешься? Ты вот ml ботал и инженерию всякую, а другие ботали как за 5 секунд понять кто перед тобой и получали в этом опыт”. В тот момент я крепко задумался. Честно говоря, к книгам вроде творчества Алана Пиза я относился примерно как к гомеопатии и заряжанию банок, но мб я просто слишком буквально все воспринимаю?

Помню был сериал “Lie to me” c Тимом Ротом – но будем честны, разве средняя hr по зуму повторяет все приемы-фокусы оттуда?

Поделитесь, пожалуйста, что вы и ваши знакомые используют чтобы понять стоит с человеком работать / связываться / иметь дело или нет?

Это можно заботать? Есть какие-то прям учебники на базе исследований? Какие-то тесты?
Раз уж зашло про психологию и навыки разбираться в людях, давно задавался вопросом секрета успеха «распутиных» от AI.

Неужели опытные акулы бизнеса и топы не видят что перед ними балаболы? Зачем презентаторов нанимают (а часто еще и уговаривают) руководителями дата-функций? Почему не предлагать им только развлекательные роли?

И вот на днях передали запрос на внешнего эксперта где значилось “из бизнеса (не консультант, не футуролог)”. Неужто наваждение прошло? 🤔

Иногда они себя называют AI-евангелистами, иногда футурологами, кибер-<username> или AI-<username>.

И как от мистического старца Распутина жена тогдашнего правителя ждала чуда в исцелении сына от гемофилии, так и от этих ребят топ-менеджеры ждут каких-то невероятных дизраптов в бизнесе. Чтобы продажи выросли минимум раз в 10, а бонус конкретного топа – раз в сто. 😆

Во время и после найма ребята делают чудесные презентации, владелец и весь топ-менеджмент компании в них влюблены, ловят каждое слово, поддерживают каждый проджект. Что что, а зажигательно, самоуверенно и самовлюбленно презентовать распутины умеют 😂 Но спустя год-полтора настает разочарование и распутиным приходится искать новую компанию (либо аккуратно перестать отсвечивать в этой компании, сохранив за собой пост, и заняться своими делами на стороне). Получается, такой вот подвид чайка-менеджеров.

Встретить их проще всего на бизнес-тренингах, в Сколково и похожих, на конференциях без модерации, круглых столах, панельных дискуссиях.

Как ни странно, работа с такими манагерами может оказаться и весьма денежной (пока у них есть кредит доверия от топов) и внезапно достаточно интересной – ведь в списке того что они успели нафантазировать и наобещать могут оказаться реально полезные нестандартные для конкретной отрасли задачи, которые вполне решаются трансфером и адаптацией технологий из соседнего домена.

Так что для DS сотрудничество с таким визионером-распутиным может оказаться не таким уж и кринжовым, а выгодным и интересным.

PS: песенка 79 года для настроения
Даже статистика не всемогуща )

Пояснительная бригада : там где отверстия от снарядов — укреплять защиту не надо , так как самолеты с такими повреждениями все же дотягивали до базы, а вот если снаряд попадал в оставшиеся места — не долетали, этот пример любят в учебниках по статистике 🙌
Кейс когда топ-манагер оказался далеко не канальей 😎 (правда это был старший вице-президент) , а направил как собрать данных для модели.

Раз в две недели я докладывал топу об успехах советского балета, увеличении надоев и космической программе благодаря внедрению ML, но חלב рано или поздно заканчивается – откуда брать новые фичи для моделей NBO/NBA? Как узнать конкретно почему наше предложение нерелевантное? Это позволит и выборку переразметить и причины попробовать устранить.

Иногда, конечно, приходили на почту поддержки крики души от клиентских менеджеров – в духе “вы там говном упоролись? Зачем мне мне лид про застраховать продукцию клиента? Это рыболовный флот – мне селедку в Атлантическом океане им застраховать?!”.

Короче, сбор обратной связи был реализован специфически – обязательное поле "комментарий", но обычно там стояли прочерки, хотя от людей, не обделенных фантазией, попадались и "пиво, чипсы, водка" -- видимо, что-то им верно подсказывало что читать их комментарии никто не будет. Угадайте наиболее частую категорию – очевидно “прочее”, , и наличие такой категории на первом уровне совсем печально. А процесс выглядел так -- раз в неделю специально обученной даме присылали выгрузку в excel, она выбрала "случайно" -- на самом деле просто первые 10 строк, долго думала и делала слайд с этими 10 комментариями и своих фантазиях о причинах такого фидбека.

А посколько KPI на деньги от моделей был только у меня, то рост конверсии от лидов тоже беспокоил в первую очередь меня (бизнес и так свои бонусы получит -- сетка план как-нибудь да выполнит).

И вот встал вопрос об обратной связи, а непонятно как правильно делать опрос. Позапускали BERTTopic на комментариях к лидам (а их было не так много), поморочили голову бизнесу. Ок, ценовые условия продукта, неценовые условия продукта, решение принимается в другом месте, продукт вообще не применим к клиенту (проектное финансирование тому кто ничего не строит или долгие депозиты компании с большими финансовыми проблемами и тд) и немного других. Переделали формы – не летит.

На очередном докладе шеф лишь вздохнул и отправил читать классику – "Жалоба как подарок” .

Внезапно это оказалось самой полезной книжкой по DS (хотя она вообще вроде бы про другое) за тот квартал. В итоге категорий стало в районе 25, они расположились по уровням, отмечались они галочками, в прочее падало менее 0.2%, поле "комментарий" перестало быть обязательным, на категории сделали модель-классификатор, а у продуктовиков появился инструмент замера фидбеков при запуске нового продукта – прямо в BI вывели как меняются доли отказов по продуктовым условиям, когда конкуренты начинают демпинговать и все в таком духе.

Угадайте, какой самый частый инсайт был для любителей поставить продукт на полку?
Тех. поддержку надо с продуктом поставлять! И вот эта штука существенно растила конверсии. Сложно было без моделей и итераций с обратной связью догадаться, ведь так? :facepalm:

А книжку не устаю рекламировать -- не только в DS поможет 🤓
Слышал что в человеке заложено чувство прекрасного, только прекрасное у всех разное

“Да, я читала Пикассо, меня так поразил он, Феллини тоже молодцом, прекрасный композитор”.

Мне вот эстетически нравятся файндинги в данных. Красиво и все тут

И вот с подачи Саши Киреева второй день любуюсь на бессмертное (полтысячи апвоутов за 6 лет) расследование про таргет из бразильского соревнования Elo .

Как в задаче с непрерывным (хотя и здесь есть caveat) таргетом догадаться что он из себя представляет? Читается реально как захватывающий детектив, рекомендую.

Ситуация с тем что таргет или фича, которые кажутся непрерывными, оказывается категорийными или отношениями – очень частая.

Вообще, в задачах спроса (и многих других) проще предсказывать не непрерывные значения (особенно бустингами), а месяц к месяцу или неделя к неделе )

Ну и на закуску – во многих соревнованиях (как и в этом, кстати) организаторы пишут что данные синтетические (так кибербеза требует), а по факту – ну вы поняли ) А еще и до конца обезличить часто забывают 😉

PS: для любителей – попробуйте найти фичу, которая кажется непрерывной, но на самом деле категорийная, здесь -- на ней (или них?) запнулась даже топ-1 automl-команда мира
Дата канальи — про «специалистов» в данных / ML / AI
В тему каналий-манагеров и их компетенций. Если с организационными способностями и операционным управлением все на поверхности – достаточно одного показательного поста, то как насчет других компетенций? Возьмем крайний случай – “умение разбираться в людях”.…
Обещал вам показать самописного бота, с помощью которого готовлюсь к behavioral interview (любят в faang/maang и последователях) и заодно практикую английский.

Еще хотелось понять насколько я оменеджерился, смогу ли сделать что-то минимально рабочее за пару вечеров.

Буду признателен за любой фидбек и мб даже кому-то бот тоже окажется полезен

Итак, прошу любить и жаловать:
@HR_behavioral_questions_bot
Интересно, почему бы этому тимлиду из вакансии ниже не устроиться ровно за те же деньги с чатботами болтать

25$ если на полную ставку это 4400 $ в мес в валюте, полная удаленка, без дурацких созвонов и "гениальных" kpi
Forwarded from ODS #jobs
Team Lead Data Scientist
400 000 – 550 000 ₽/месяц
Удаленка или офис, Фултайм

Вакансия идеально подойдет как опытным Team Lead, желающим решать интересные задачи в области оптимизации ценообразования, так и специалистам с прикладным опытом и подтвержденными успехами в решении задач оптимизации ценообразования…(читать далее)
Скрытые KPI

Выше мы с вами рассуждали о KPI, которые вообще бывают у DS-ветки.

Но самые важные, от которых напрямую зависят ваши повышения и в карьере и в грейде, вы не найдете в формах оценки и ревью, о них вам на собеседованиях не скажут HR.

Если есть предположения о чем пойдет речь – пишите в комментариях под постом 😄.

Свою версию изложу как обычно с кейсами и утром )
Скрытые KPI – моя версия

Спасибо вам за комментарии под предыдущим постом, реально заставили задуматься и вспомнить разных ситуаций

Дисклемер: речь о корпорациях

А картинка из статьи на хабре, статью комментировать не буду, но картинка классная.

Сначала кейсы

Кейс 1
Как вы думаете, что будет если удачно показать презентацию акционеру?
Внеплановая премия на 50М рублей – как вам?

Кейс 2
Очень крепкий начальник DS-отдела тащит звездный (уникальный, имиджевый, денежный, на благо клиентам и тд) проект, визибилити на самом высоком уровне, получает грейд, звание, еще пару команд. А меньше чем через год вынужден уволиться. Почему?

Кейс 3
Регулярная оперативка у президента Банка, президент не в настроении. AI идет четвертым, последним вопросом. Шеф докладывает результаты моей команды – гробовое молчание секунд 15, вступается один старший вице-президент – “мои ребята провалидировали, все сделано грамотно”, затем второй – “а мои уже пропилотировали, работает, эффекты есть”, мы с шефом выдыхаем, президент выдает – “а для физиков когда это же сделаете?”.

Давайте попробуем суммаризировать этот опыт:

1) Больше всех в колхозе пахала лошадь, но председателем она так и не стала => визибилити очень важен

2) Если вы сделали один классный и значимый проект – вы задали планку, и у вас даже после повышения может не хватить задач / полномочий / ресурсов / гороскопа сделать что-то такого же масштаба

3) А “на радарах” надо быть регулярно, желательно либо с важной либо с хайповой темой – а фокус постоянно меняется, поэтому темы тоже надо менять – люто плюсую комментарий под предыдущим постом на тему новизны и early adopter

4) Достижения должны не убывать по значимости => правильное планирование и револьверные схемы

5) Любой манагер обучен представлять результаты своих сотрудников как свои. Как же тогда получить визибилити? Искать недооцененные темы, где шеф видит вероятность провала (и последствия там таковы что кадровые решения неминуемы – тогда он всегда сможет пожертвовать тем кто докладывал и сослаться на ошибку сотрудника, который за это был им уволен).

6) Надо уметь балансировать между стремлением “сделать нормально” и закрыть тех. долги и ростом вширь в хайповые темы. Инвестируйте в рост тоже, копать картоху можно долго

7) Решать все проблемы шефа плохая стратегия если вам не платят 100500 денег – кто же вас отпустит на повышение если вы так удобны? Если у вас хорошие отношения с начальником – значит, вам недоплачивают. Вообще залог хороших отношений с людьми – с вас они имеют больше, чем вы с них. И быть на расстоянии повышает шанс воспользоваться возможностью из п4. Здесь, как и из любого правила, есть исключение -- если вас купили с потрохами, еще и с опережением ваших запросов -- то логично честно впрячься -- такая ситуация хоть и может оказаться неустойчивой, но сулит нереально редкий баланс нервы / деньги

8) А вот решать проблемы шефа своего шефа – работающая история. Ведь стейкхолдер так похож на shareholder ;)

9) У акционера проблемой могут быть не деньги, а померяться чем-н с акционерами другой крупной компании

10) Поддержка смежников (за периметром феода вашего синьора) критически важна – более того, не раз наблюдал “десанты” из соседних подразделений – испытанная временем практика – "женишься" сам или "женишь сына" на "дочке" соседнего феодала и он перестает тебя атаковать (особенно полезно когда тебя атакуют другие, с которыми ты породниться или заключить союз не успел). Речь о приеме на работу к себе в структуру на ненизовую должность -- еще таких называют парашютистами

11) Не встревать в конфликтные темы (когда две вертикали бьются за какую-то бизнес-линию или даже зону ответственности) – они потом решение найдут, а ваша голова полетит. Паны дерутся – у холопов чубы трещат.

Итого: у всех, кто хочет расти, есть незафиксированный kpi “не реже раза в месяц/квартал -- в зависимости от левела -- доложить на уровне шеф+1 результаты, имеющие новизну, выхлоп и при этом относящимся либо к сиюминутно важным фокусам того уровня либо к жизненно-важной теме для кор-бизнеса”
2025/02/05 11:01:59
Back to Top
HTML Embed Code: