Telegram Group & Telegram Channel
Всегда бесило что когда речь заходит о фичах клиента, манагеры произносят аллилуйя — «пол-возраст». Им вторят канальи-аналитики, которые про «составим портрет клиента продукта» Еще бы расу добавили - и получился бы трельяж — сексизм, эйджизм, расизм.
Тем не менее, качество таргетирования рекламы часто проверяют на попадание в пол и возраст.
И хотя их можно предсказать даже только лишь по посещению страничек в сети – писал про задачу на хабре – и мы с ребятами запускали сореву MTS ML Cup – на 2300 участников, все равно смысла предсказывать эти таргеты я не улавливал (кроме как доказать внешнему измерителю что мы могем в таргетинг рекламы – хотя внешний измеритель откуда знает про пол и возраст? По 10 тыс панелистам?). Почему фичи юзера это не статистики, описывающие его поведение, или cf-эмбеддинги, построенные по потребляемому контенту, а пол и возраст? На заре скор-карт в банках в 70е еще можно было понять (потому как понятно откуда эти фичи брать и как с ними работать), но сейчас?
Если уж так хочется составить портрет клиента – потрудитесь спросить себя – для какой конкретно бизнес-цели? Чтобы знать в каких каналах и как его лучше привлечь? Ну тогда и стройте модели на тему привлечения (тот же аплифт). Затем чтобы понять ценовую политику? Займитесь LTV или сразу ценообразованием. И т.д.
Возражение на ум приходит тут только одно — знаем мы ваших ml-чуваков — запихнут в фичи какой-нибудь лик или откровенную чушь.
Вспоминается случай когда строили модель определения жертв мошенников для одного серо-бур-малинового банка и топ-1 фичей оказались звонки из этого самого банка на телефон жертвы. Или другой кейс где вероятность дефолта заемщика очень сильно зависела от региона.
И если вы пошли классическим табличным подходом — наинжинирить фичей и обучить понятный алгоритм с понятными свойствами и возможностью мерять uncertaincy в каждой точке на инференсе — то остановиться и проверить что за фичи в топе, каков их смысл в бизнесе, и как меняется их важность со временем — вас сможет подстраховать. Но если вы просто учили классную сеть — результат может быть сюрпризом, а не все сюрпризы приятные. Хотя и в этом случае интерпретация возможна, только копаться чуть подольше придется (и возможно потом трейн пересобирать).
В любом случае для меня фича юзера это что-то вроде «частота использования сервиса» нежели «возраст по ДУЛ (документ, удостоверяющий личность)».



group-telegram.com/datarascals/5
Create:
Last Update:

Всегда бесило что когда речь заходит о фичах клиента, манагеры произносят аллилуйя — «пол-возраст». Им вторят канальи-аналитики, которые про «составим портрет клиента продукта» Еще бы расу добавили - и получился бы трельяж — сексизм, эйджизм, расизм.
Тем не менее, качество таргетирования рекламы часто проверяют на попадание в пол и возраст.
И хотя их можно предсказать даже только лишь по посещению страничек в сети – писал про задачу на хабре – и мы с ребятами запускали сореву MTS ML Cup – на 2300 участников, все равно смысла предсказывать эти таргеты я не улавливал (кроме как доказать внешнему измерителю что мы могем в таргетинг рекламы – хотя внешний измеритель откуда знает про пол и возраст? По 10 тыс панелистам?). Почему фичи юзера это не статистики, описывающие его поведение, или cf-эмбеддинги, построенные по потребляемому контенту, а пол и возраст? На заре скор-карт в банках в 70е еще можно было понять (потому как понятно откуда эти фичи брать и как с ними работать), но сейчас?
Если уж так хочется составить портрет клиента – потрудитесь спросить себя – для какой конкретно бизнес-цели? Чтобы знать в каких каналах и как его лучше привлечь? Ну тогда и стройте модели на тему привлечения (тот же аплифт). Затем чтобы понять ценовую политику? Займитесь LTV или сразу ценообразованием. И т.д.
Возражение на ум приходит тут только одно — знаем мы ваших ml-чуваков — запихнут в фичи какой-нибудь лик или откровенную чушь.
Вспоминается случай когда строили модель определения жертв мошенников для одного серо-бур-малинового банка и топ-1 фичей оказались звонки из этого самого банка на телефон жертвы. Или другой кейс где вероятность дефолта заемщика очень сильно зависела от региона.
И если вы пошли классическим табличным подходом — наинжинирить фичей и обучить понятный алгоритм с понятными свойствами и возможностью мерять uncertaincy в каждой точке на инференсе — то остановиться и проверить что за фичи в топе, каков их смысл в бизнесе, и как меняется их важность со временем — вас сможет подстраховать. Но если вы просто учили классную сеть — результат может быть сюрпризом, а не все сюрпризы приятные. Хотя и в этом случае интерпретация возможна, только копаться чуть подольше придется (и возможно потом трейн пересобирать).
В любом случае для меня фича юзера это что-то вроде «частота использования сервиса» нежели «возраст по ДУЛ (документ, удостоверяющий личность)».

BY Дата канальи — про «специалистов» в данных / ML / AI




Share with your friend now:
group-telegram.com/datarascals/5

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

Recently, Durav wrote on his Telegram channel that users' right to privacy, in light of the war in Ukraine, is "sacred, now more than ever." During the operations, Sebi officials seized various records and documents, including 34 mobile phones, six laptops, four desktops, four tablets, two hard drive disks and one pen drive from the custody of these persons. Telegram was co-founded by Pavel and Nikolai Durov, the brothers who had previously created VKontakte. VK is Russia’s equivalent of Facebook, a social network used for public and private messaging, audio and video sharing as well as online gaming. In January, SimpleWeb reported that VK was Russia’s fourth most-visited website, after Yandex, YouTube and Google’s Russian-language homepage. In 2016, Forbes’ Michael Solomon described Pavel Durov (pictured, below) as the “Mark Zuckerberg of Russia.” Friday’s performance was part of a larger shift. For the week, the Dow, S&P 500 and Nasdaq fell 2%, 2.9%, and 3.5%, respectively. Right now the digital security needs of Russians and Ukrainians are very different, and they lead to very different caveats about how to mitigate the risks associated with using Telegram. For Ukrainians in Ukraine, whose physical safety is at risk because they are in a war zone, digital security is probably not their highest priority. They may value access to news and communication with their loved ones over making sure that all of their communications are encrypted in such a manner that they are indecipherable to Telegram, its employees, or governments with court orders.
from sg


Telegram Дата канальи — про «специалистов» в данных / ML / AI
FROM American