Telegram Group & Telegram Channel
Всегда бесило что когда речь заходит о фичах клиента, манагеры произносят аллилуйя — «пол-возраст». Им вторят канальи-аналитики, которые про «составим портрет клиента продукта» Еще бы расу добавили - и получился бы трельяж — сексизм, эйджизм, расизм.
Тем не менее, качество таргетирования рекламы часто проверяют на попадание в пол и возраст.
И хотя их можно предсказать даже только лишь по посещению страничек в сети – писал про задачу на хабре – и мы с ребятами запускали сореву MTS ML Cup – на 2300 участников, все равно смысла предсказывать эти таргеты я не улавливал (кроме как доказать внешнему измерителю что мы могем в таргетинг рекламы – хотя внешний измеритель откуда знает про пол и возраст? По 10 тыс панелистам?). Почему фичи юзера это не статистики, описывающие его поведение, или cf-эмбеддинги, построенные по потребляемому контенту, а пол и возраст? На заре скор-карт в банках в 70е еще можно было понять (потому как понятно откуда эти фичи брать и как с ними работать), но сейчас?
Если уж так хочется составить портрет клиента – потрудитесь спросить себя – для какой конкретно бизнес-цели? Чтобы знать в каких каналах и как его лучше привлечь? Ну тогда и стройте модели на тему привлечения (тот же аплифт). Затем чтобы понять ценовую политику? Займитесь LTV или сразу ценообразованием. И т.д.
Возражение на ум приходит тут только одно — знаем мы ваших ml-чуваков — запихнут в фичи какой-нибудь лик или откровенную чушь.
Вспоминается случай когда строили модель определения жертв мошенников для одного серо-бур-малинового банка и топ-1 фичей оказались звонки из этого самого банка на телефон жертвы. Или другой кейс где вероятность дефолта заемщика очень сильно зависела от региона.
И если вы пошли классическим табличным подходом — наинжинирить фичей и обучить понятный алгоритм с понятными свойствами и возможностью мерять uncertaincy в каждой точке на инференсе — то остановиться и проверить что за фичи в топе, каков их смысл в бизнесе, и как меняется их важность со временем — вас сможет подстраховать. Но если вы просто учили классную сеть — результат может быть сюрпризом, а не все сюрпризы приятные. Хотя и в этом случае интерпретация возможна, только копаться чуть подольше придется (и возможно потом трейн пересобирать).
В любом случае для меня фича юзера это что-то вроде «частота использования сервиса» нежели «возраст по ДУЛ (документ, удостоверяющий личность)».



group-telegram.com/datarascals/5
Create:
Last Update:

Всегда бесило что когда речь заходит о фичах клиента, манагеры произносят аллилуйя — «пол-возраст». Им вторят канальи-аналитики, которые про «составим портрет клиента продукта» Еще бы расу добавили - и получился бы трельяж — сексизм, эйджизм, расизм.
Тем не менее, качество таргетирования рекламы часто проверяют на попадание в пол и возраст.
И хотя их можно предсказать даже только лишь по посещению страничек в сети – писал про задачу на хабре – и мы с ребятами запускали сореву MTS ML Cup – на 2300 участников, все равно смысла предсказывать эти таргеты я не улавливал (кроме как доказать внешнему измерителю что мы могем в таргетинг рекламы – хотя внешний измеритель откуда знает про пол и возраст? По 10 тыс панелистам?). Почему фичи юзера это не статистики, описывающие его поведение, или cf-эмбеддинги, построенные по потребляемому контенту, а пол и возраст? На заре скор-карт в банках в 70е еще можно было понять (потому как понятно откуда эти фичи брать и как с ними работать), но сейчас?
Если уж так хочется составить портрет клиента – потрудитесь спросить себя – для какой конкретно бизнес-цели? Чтобы знать в каких каналах и как его лучше привлечь? Ну тогда и стройте модели на тему привлечения (тот же аплифт). Затем чтобы понять ценовую политику? Займитесь LTV или сразу ценообразованием. И т.д.
Возражение на ум приходит тут только одно — знаем мы ваших ml-чуваков — запихнут в фичи какой-нибудь лик или откровенную чушь.
Вспоминается случай когда строили модель определения жертв мошенников для одного серо-бур-малинового банка и топ-1 фичей оказались звонки из этого самого банка на телефон жертвы. Или другой кейс где вероятность дефолта заемщика очень сильно зависела от региона.
И если вы пошли классическим табличным подходом — наинжинирить фичей и обучить понятный алгоритм с понятными свойствами и возможностью мерять uncertaincy в каждой точке на инференсе — то остановиться и проверить что за фичи в топе, каков их смысл в бизнесе, и как меняется их важность со временем — вас сможет подстраховать. Но если вы просто учили классную сеть — результат может быть сюрпризом, а не все сюрпризы приятные. Хотя и в этом случае интерпретация возможна, только копаться чуть подольше придется (и возможно потом трейн пересобирать).
В любом случае для меня фича юзера это что-то вроде «частота использования сервиса» нежели «возраст по ДУЛ (документ, удостоверяющий личность)».

BY Дата канальи — про «специалистов» в данных / ML / AI




Share with your friend now:
group-telegram.com/datarascals/5

View MORE
Open in Telegram


Telegram | DID YOU KNOW?

Date: |

This ability to mix the public and the private, as well as the ability to use bots to engage with users has proved to be problematic. In early 2021, a database selling phone numbers pulled from Facebook was selling numbers for $20 per lookup. Similarly, security researchers found a network of deepfake bots on the platform that were generating images of people submitted by users to create non-consensual imagery, some of which involved children. The original Telegram channel has expanded into a web of accounts for different locations, including specific pages made for individual Russian cities. There's also an English-language website, which states it is owned by the people who run the Telegram channels. Founder Pavel Durov says tech is meant to set you free I want a secure messaging app, should I use Telegram? But because group chats and the channel features are not end-to-end encrypted, Galperin said user privacy is potentially under threat.
from hk


Telegram Дата канальи — про «специалистов» в данных / ML / AI
FROM American