Telegram Group Search
Монтекарлить - изучать поведение статистик при помощи генерации большого числа выборок и расчета нужных показателей по ним
AB марафон - первый поток done

Провел первый поток марафона по АБ тестам. Идея марафона была в том чтобы за неделю человек, который никогда не делал АБ тесты смог бы пройти путь: поиск точки роста → формирование гипотез → дизайн АБ → валидация и анализ результата АБ теста.

При этом я не хотел чтобы этот тренинг превратился в курс по статистике, хотелось именно дать практику и погружение на простом примере. Т.к. я считаю, что на старте важно быстро получить общую картину, а потом уходить в детали.

Поэтому мы взяли конкретный продуктовый кейс по поиску точек роста в интернет магазине с последующим проведением АБ теста.

Слушатели считали экономику магазина, проводили сегментацию, рассчитывали воронки, интерпретировали ux метрики, анализировали дизайн основных страниц нашего учебного магазина, формировали гипотезы, дизайнили АБ тест, боролись с ошибками в данных и SRM, а после считали результат АБ теста и принимали решение стоит ли катить новый вариант.

Некоторые уроки получились достаточно объемные, я думал, что они будут меньше, поэтому многие не успели сделать все задания и я продлил срок приема заданий, чтобы участники могли доделать и получить обратную связь.

Также вскрылись моменты где стоит переработать логику подачи материала и некоторые моменты раскрыть более детально, поэтому с каждым потоком марафон будет апгрейдиться и становиться интереснее.

Мне понравился такой формат работы, было ощущение что пишу сценарий к фильму. Хочу еще раз сказать спасибо всем участникам первого потока.🫶
3 признака, что у вас нет никакого data driven, а есть лишь фикция 😵‍💫

1. Отсутствие процесса контроля качества данных.
В компании много систем, они все имеют какую-то свою логику учета, между ними настроены потоки данных, куча скриптов, таблиц, дашбордов. Все это обязательно разойдется, не будет биться между собой, часть данных вообще потеряется.

Если у вас нет автоматизированной системы, которая контролирует полноту данных и сравнивает данные в разных системах, то скорее всего у вас уже есть серьезные расхождения и нет единой точки правды, тогда о каком data driven может идти речь?

2. Отсутствие методологии работы с данными и анализа
Начнем с того, что далеко не все знают, что такое пресловутый EDA, а просто верят данным, которые им поставляют системы, у которых нет контроля качества данных.

Другой вопрос это когда в компании есть какой-то регулярный аналитический процесс типа анализ трафика, анализ АБ тестов, анализ управленческой отчетности, но почему нигде нет описанной методологии как это должно делаться и каждый сотрудник может это делать своим уникальным образом.

По итогу одни и те же метрики в разных типовых анализах могут выглядеть по разному и не сходиться друг с другом.

3. Корпоративная культура
Питер Друкер сказал "корпоративная культура ест стратегию на завтрак", тоже самое можно сказать про data driven. "Корпоративная культура ест data driven на завтрак".

Если в компании декларируют, что у них data driven, а потом по результатам АБ теста "самый большой босс" может отправить результат красного АБ тест в продакшн, только потому что он его считает лучше, то этот культурный код будет считываться всеми в компании и data-driven будет только имитацией, а не культурным кодом компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
Зимний туристический сезон объявляю открытым🔥

Вы как провели выходные?
👨🏻‍💻 Ошибки при оценке SRM

Я уже написал несколько постов про SRM, поэтому подробно рассказывать про это не буду. Сегодня поговорим про 2 ошибки при проверке выборок на дисбаланс.

Когда мы задали конфиг деления наблюдений в АБ тесте 50/50, то ожидаем, что получим близкое деление к запланированному. Проверить корректность деления можно при помощи стат. критерия хи2.

С одной стороны все просто, с другой как всегда есть нюансы. Сегодня поговорим про 2 ошибки, которые можно допустить при оценке SRM.

🛑 Выбор единицы анализа, вместо единицы рандомизации для оценки SRM
Зачастую сплитование происходит по пользователям, а для анализа результатов АБ теста иногда используют метрики посчитанные по сессиям.

Некоторые не задумываясь о различии пользователей и сессий, могут взять сессии для оценки SRM, но это не верно, т.к. сплитование происходило по пользователям, а сессия это некоторая производная от пользователя.

Различия в тестируемых вариантах может влиять на число сессий, которое сгенерирует пользователь в каждом из вариантов экспа, а значит такая сущность как сессия не подойдет для оценки SRM. Есть пример в этом посте

🛑 Оценка SRM по пользователям по дням
Берем каждый день всех пользователей попавших в эксперимент и оцениваем SRM. Тут хотя мы и берем в качестве анализа пользователя, но один и тот же пользователь мог возвращаться в разные дни, а возвращаемость это опять таки производная от пользователя.

На нее может воздействовать само экспериментальное изменение, т.е. даже при корректном сплите вы можете получить разную возвращаемость в группах.

Вы будете видеть дисбаланс при таком методе подсчета. Кроме этого важно помнить, что хи2 как и любой стат критерий имеет ошибку первого рода и чем больше сравнений вы сделаете тем больше вероятность допустить ошибку первого рода и найти дисбаланс там где его нет.


Как проверять SRM?
1. Для оценки SRM нам важно брать в качестве наблюдений именно единицу рандомизации, т.е. если ваша сплит система делит по пользователям, то нам нужны id пользователей.

2. Учитывать каждое наблюдение (пользователя) нужно только 1 раз в выборке, независимо от того сколько раз он вернулся в продукт.

3. Производить подсчет SRM для АБ теста тоже желательно только 1 раз, чтобы держать ошибку первого рода в рамках альфы, либо применить какую-то поправку для корректировки альфы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Машина со сгоревшим сцеплением
Вы когда-нибудь ехали на машине со сгоревшим сцеплением? Вот вы едете по дороге, хотите ускориться, втыкаете передачу повыше, жмете газ в пол, мотор рычит, а машина еле-еле ускоряется.

Вот у меня последнее время какое-то такое ощущение. Что-то делаю, пытаюсь газовать по разным фронтам, вроде правильные действия делаю, а ускорения нет, как буд то что-то сломано. Кажется, что можно быстрее, выше, сильнее, есть потенциал, есть силы, но оно не работает😑 Бывало такое?
Please open Telegram to view this post
VIEW IN TELEGRAM
Можно ли получить отрицательный эффект после раскатки, если мы получили стат. значимый рост метрики в АБ?
Anonymous Poll
98%
да
2%
нет
У NEWHR вышла ежегодная подборка "за кем следят аналитики?"

Там список экспертов и каналов. Спасибо, что упомянули мой канал. В закрытый список экспертов я не попал, но попал в рейтинг вне списка.

Т.е. люди предлагали свои варианты экспертов и каналов в поле для свободного ответа. А это даже возможно круче, т.к. одно дело когда тебе дали список и ты выбираешь, а другое, когда надо вспомнить эксперта😁

Очень рад, что читаете меня, надеюсь что мой контент несет вам пользу и рост🔥

Буду рад если под этим постом напишете обратную связь по моему каналу. Что нравится? Как он вам помог? Может наоборот, что-то плохо или хочется какой-то новый формат?

Обратная связь помогает мне развивать канал, жду вас в комментариях ✍️

Ссылка на лендинг где можно получить список
Please open Telegram to view this post
VIEW IN TELEGRAM
Моя аналитическая суперсила

Нет - это не АБ тесты и даже не поиск инсайтов. Моя супер сила - это выявление проблем с данными. Я вот честное слово не хочу решать проблемы с данными, а хочу исследования и АБ тесты.

Но почему-то, как-то случайно нахожу разные проблемы. Например, у меня был чек-лист для аудита Google analytics на 30 пунктов из всяких найденных косяков, даже проводил курс "качество данных Google Analytics", у меня есть отдельный чек-лист по валидации АБ тестов, есть чек-лист по валидации сплитовалки и еще всякое.

В различных методиках и дашбордах я периодически нахожу ошибки. Никогда не хотел заниматься вопросами качества данных, оно как буд то само меня находит😁.

А у вас какая аналитическая супер сила?
Кого почитать про аналитику?🧐
На хабре вышла статья, с подборкой авторских ТГ-каналов. Я подписан на большую часть каналов из этой подборки, так что контент там проверенный и интересный. Мой канал там тоже есть😌

На мой взгляд подборка получилась довольно сбалансированная, есть каналы про продуктовый подход, маркетинговую аналитику, bi, аналитические инструменты, ML.

Рад что нет каналов про AI, если честно надоело слышать про AI из каждого утюга, в то время как 95% компаний не может просто порядок в данных навести.

Собрал всю это красоту - Андрон Алексанян. У него в канале тоже всегда годный контент. Вот из недавнего скрипт в colab для когортного анализа, а также еще много интересного.

По ссылке можно сразу всю папку с каналами добавить в ТГ.
Незакрытый гештальт

Всю дорогу на пути аналитического развития меня двигали незакрытые гештальты.

Когда я пришел работать в маркетинг меня всегда мучали вопросы, а как понять что именно нужно делать чтобы получить рост прибыли? А как оценить результат?

Поэтому я всегда изучал аналитические подходы и инструменты. Каждый раз это выглядело как вызов, "а смогу ли я это изучить и найти где применить?"

✔️ Узнал, что с помощью веб-аналитики можно изучить поведение юзеров → изучил → внедрил.

✔️ Узнал, что с помощью исследований можно повысить точность решений → изучил → внедрил.

✔️ Узнал, что с помощью системы сквозной аналитики можно считать окупаемость до денег → изучил → внедрил.

✔️Узнал, что с помощью sql, bi, python можно решать большинство аналитических задач → изучил → внедрил.

✔️Узнал, что с помощью АБ тестов можно сравнивать эффективность разных решений → изучил → внедрил.

В каждое из этих направлений все еще можно углубляться и совершенствоваться, но для себя я больше не вижу в этом каких-то глобальных вызовов.

Можно конечно идти в ML, но лично меня не привлекает это направление, я не хочу становиться ML-инженером.

Поэтому в конце года я задумался о том куда мне интересно развиваться, пока у меня нет готового ответа.

Наблюдая за собой в течении года я пришел к выводу, что мне нравилось заниматься вопросами популяризации АБ тестов в банке, проведения митапов, участия в конференциях , помогать коллегам разобраться с АБ тестами. Я бы сказал, что мне нравится создавать пространство для развития людей и компаний в аналитическом направлении.

А вы куда хотели бы развиваться в 2025?
Please open Telegram to view this post
VIEW IN TELEGRAM
Ну что всех с наступающим новым годом, проведите праздничные дни на полную катушку 📣🎶🚀
Лично я планирую разгрузить голову, не думать ни о чем аналитическом, а наоборот сконцентрироваться на работе руками и получать приятные впечатления душой и телом.

За период праздников планирую:

1. Тусить с друзьями на турбазе, возможно выбраться куда-то на холмы и пригорки, побродить по снегу или какому-то лесу
2. Пострелять зомбаков на арене виртуальной реальности в большой компании
3. Посетить с экскурсией доменный цех Магнитогорского металлургического комбината. Посмотреть как льется жидкий метал и 20 метровые печи
4. Сходить в баню
5. Переделать домашние дела из серии, подкрутить полку, починить стул и прочее
6. Покататься на коньках
7. Сходить к врачу
8. Ходить по гостям

Так что желаю вам отдохнуть от компуктеров и телефонов тоже, чтобы перезарядить свои батарейки. Увидимся в новом году☕️
Please open Telegram to view this post
VIEW IN TELEGRAM
2025/02/15 19:17:00
Back to Top
HTML Embed Code: