Недавно закончился 4- ый поток моего курса, поэтому время публиковать финальные проекты слушателей. Первый раз на моем курсе часть проектов была выполнена по запросу бизнес- заказчиков.
Юля Васильева(@Yulia_Yadrikhinskaya) сделала проект по рекомендации локаций для агентства среднесрочной аренды квартир в Тель-Авиве Midterm Dan.
Какие данные и подходы она использовала, а также какие результаты получила, читайте по ссылке
Юля Васильева(@Yulia_Yadrikhinskaya) сделала проект по рекомендации локаций для агентства среднесрочной аренды квартир в Тель-Авиве Midterm Dan.
Какие данные и подходы она использовала, а также какие результаты получила, читайте по ссылке
Telegraph
ВЫБОР ПРИВЛЕКАТЕЛЬНЫХ ЛОКАЦИЙ ДЛЯ СРЕДНЕСРОЧНОЙ АРЕНДЫ ЖИЛЬЯ
В Тель-Авив часто приезжают пожить у моря, поработать или вкусно поесть. И, конечно, возникает вопрос снятия жилья. Люди ищут квартиру на 3-6 месяцев, учитывая такие факторы, как стоимость аренды и близость к необходимым удобствам (см. гипотезы ниже). Моя…
По окончании курса слушатели не только делают проекты, но некоторые еще и дорабатывают библиотеки python, которые мы на курсе проходим.
Ниже пост от Максима, слушателя 3-ьего потока, который сделал свой extension к модели regression kriging- регрессионной модели усиленной с помощью пространственной модели, кригинг .
Ниже пост от Максима, слушателя 3-ьего потока, который сделал свой extension к модели regression kriging- регрессионной модели усиленной с помощью пространственной модели, кригинг .
Forwarded from Максим К.
Привет! 🌏 Сегодня немного о кригинге.
Кригинг - это метод интерполяции. Он полезен при работе с данными, которые имеют неравномерное распределение или пропуски, и позволяет создавать карты с плавными переходами и естественными градиентами. 🔍
Основное преимущество кригинга заключается в его способности учитывать пространственные корреляции между точками данных, что обеспечивает более точные и надежные результаты по сравнению с другими методами интерполяции. ⚖️
🌟 Ниже небольшой, но мощный Python-класс, который соединил в себе силу регрессионных моделей и кригинга! 📊🌎
https://github.com/redsun1988/KreegingGridSearchCv/tree/master
Этот класс совместим со sklearn и позволяет легко интегрировать его c различными регрессионными моделями. А функция кригинга, поможет уменьшить ошибку предсказывая в областях, где информация отсутствует или ограничена.
Главная его особенность - возможность подбора оптимальных мета параметров для регрессионных моделей и кригинга с помощью GridSearchCv. Это позволяет экспериментировать с различными конфигурациями и находить наиболее подходящую модель для ваших данных.
Хотите больше узнать о Кригинге?
Вот ссылка на книгу Fifty Years of Kriging
Кригинг - это метод интерполяции. Он полезен при работе с данными, которые имеют неравномерное распределение или пропуски, и позволяет создавать карты с плавными переходами и естественными градиентами. 🔍
Основное преимущество кригинга заключается в его способности учитывать пространственные корреляции между точками данных, что обеспечивает более точные и надежные результаты по сравнению с другими методами интерполяции. ⚖️
🌟 Ниже небольшой, но мощный Python-класс, который соединил в себе силу регрессионных моделей и кригинга! 📊🌎
https://github.com/redsun1988/KreegingGridSearchCv/tree/master
Этот класс совместим со sklearn и позволяет легко интегрировать его c различными регрессионными моделями. А функция кригинга, поможет уменьшить ошибку предсказывая в областях, где информация отсутствует или ограничена.
Главная его особенность - возможность подбора оптимальных мета параметров для регрессионных моделей и кригинга с помощью GridSearchCv. Это позволяет экспериментировать с различными конфигурациями и находить наиболее подходящую модель для ваших данных.
Хотите больше узнать о Кригинге?
Вот ссылка на книгу Fifty Years of Kriging
GitHub
GitHub - redsun1988/KreegingGridSearchCv: A small extension over pykrige to support GridSearchCV and automatically fit the krige…
A small extension over pykrige to support GridSearchCV and automatically fit the krige model over regression's model error - redsun1988/KreegingGridSearchCv
Несколько около гео data science позиций в Лондоне и на Кипре в Wheely. За референсом пишите @mann_sarah
Ссылка
Ссылка
Linkedin
12,036,000+ jobs in Worldwide
Today's top 12,036,000+ jobs in Worldwide. Leverage your professional network, and get hired. New jobs added daily.
Со временем все больше убеждаюсь, что важным компонентом анализа городских данных является понимание основ устройства города: экономических, социальных, экологических, правовых и тд. Поэтому тем, кто как и я, пришел в сферу из дата аналитики, рекомендую присмотреться к новости ниже.
P.S. Я пожертвовала вечером выходного и записалась на теорию социологии города к Петру)
Онлайн-школа урбанистики и городских исследований «Города» открывает новый поток обучения!
Миссия этого проекта — делиться знаниями в сфере урбанистики и городских исследований, объединять единомышленников и развивать сообщество урбанистов, архитекторов, градостроителей, управленцев, культурологов и активных горожан.
Преподаватели Школы — известные в своих сферах специалисты, которые получили знания в полях и создали авторские курсы. Программы будут интересны как профессионалам, так и тем, кто только начинает погружаться в сферу урбанистики.
«География для архитекторов» от главного редактора журнала «Экоурбанист» Ольги Максимовой, «Социальное проектирование в малых городах» от культуролога и социального антрополога Дмитрия Лисицина, первый в России онлайн-курс по созданию дог-френдли среды от автора проекта «Собакин город» Артёма Гебелева — в новом потоке Школы 8 курсов, а ещё — медленный книжный клуб, где вместе с единомышленниками можно будет обсудить интересные книги по урбанистике.
📌Подробнее прочитать о курсах и записаться вы можете на сайте Школы: https://gorodaschool.ru/. Приглашаем!
P.S. Я пожертвовала вечером выходного и записалась на теорию социологии города к Петру)
Онлайн-школа урбанистики и городских исследований «Города» открывает новый поток обучения!
Миссия этого проекта — делиться знаниями в сфере урбанистики и городских исследований, объединять единомышленников и развивать сообщество урбанистов, архитекторов, градостроителей, управленцев, культурологов и активных горожан.
Преподаватели Школы — известные в своих сферах специалисты, которые получили знания в полях и создали авторские курсы. Программы будут интересны как профессионалам, так и тем, кто только начинает погружаться в сферу урбанистики.
«География для архитекторов» от главного редактора журнала «Экоурбанист» Ольги Максимовой, «Социальное проектирование в малых городах» от культуролога и социального антрополога Дмитрия Лисицина, первый в России онлайн-курс по созданию дог-френдли среды от автора проекта «Собакин город» Артёма Гебелева — в новом потоке Школы 8 курсов, а ещё — медленный книжный клуб, где вместе с единомышленниками можно будет обсудить интересные книги по урбанистике.
📌Подробнее прочитать о курсах и записаться вы можете на сайте Школы: https://gorodaschool.ru/. Приглашаем!
Telegram
Города: Школа Урбанистики
Онлайн-школа, в которой мы делимся знаниями в сфере урбанистики и городских исследований. Доступно и увлекательно для каждого: и начинающего, и профессионала.
Старт нового потока обучения — февраль 2025.
➡️ Наш сайт: http://gorodaschool.ru
Старт нового потока обучения — февраль 2025.
➡️ Наш сайт: http://gorodaschool.ru
Тот случай, когда и аналитиком быть не надо)) Обычно говорят "как грибов", теперь буду говорить "Как McDonald's". Не знаю, к сожалению, источник картинки
Не столько про данные, сколько про хорошее и полезное исследование для горожан:
Редакторское бюро «Гладлакс» выпустило спецпроект о том, как пешеходам оставаться в безопасности на дорогах.
В статье приведены цифры (данные ГИБДД, могут содержать неточности) и свидетельства, которые, к сожалению, потверждают, что пешеход всегда в зоне риска и нужно оставаться бдительными.
Из того, что зацепило меня:
- в октябре и ноябре происходит больше всего дорожных аварий с участием пешеходов ( удивляет правда, что только 7% аварий без пешеходов)
- Почти треть от всех ДТП в России за 2023 год произошла именно с пешеходами
- Среди смертельных случаев в 3 из 4 раз виноват пешеход
- авторы подтверждают, что ошибки проектирования повышают риск аварий, включая смертельные
Редакторское бюро «Гладлакс» выпустило спецпроект о том, как пешеходам оставаться в безопасности на дорогах.
В статье приведены цифры (данные ГИБДД, могут содержать неточности) и свидетельства, которые, к сожалению, потверждают, что пешеход всегда в зоне риска и нужно оставаться бдительными.
Из того, что зацепило меня:
- в октябре и ноябре происходит больше всего дорожных аварий с участием пешеходов ( удивляет правда, что только 7% аварий без пешеходов)
- Почти треть от всех ДТП в России за 2023 год произошла именно с пешеходами
- Среди смертельных случаев в 3 из 4 раз виноват пешеход
- авторы подтверждают, что ошибки проектирования повышают риск аварий, включая смертельные
Гладлакс
Как пешеходу остаться в живых
Помашите водителю. А еще наденьте светоотражатель, посмотрите на новую полосу дороги и почитайте наш материал, как снизить риски для пешеходов
Мы с Женей (@zhenks_notes) продолжаем общаться с основателями российских стартапов в сфере геоинформатики, чтобы узнать их истории, и как в условиях текущей глобальной турбулентности они строят стратегии развития своих компаний.
В этот раз мы общались с Ольгой Ведерниковой, основательницей геоаналитической платформы Эпсилон Метрикс. От Оли мы узнали, что значит развивать геоаналитическую платформу сегодня на российском рынке и как происходит трансформация из менеджера банка в основателя стартапа. Прочитать краткую версию нашего разговора можно тут
В этот раз мы общались с Ольгой Ведерниковой, основательницей геоаналитической платформы Эпсилон Метрикс. От Оли мы узнали, что значит развивать геоаналитическую платформу сегодня на российском рынке и как происходит трансформация из менеджера банка в основателя стартапа. Прочитать краткую версию нашего разговора можно тут
Telegraph
Разговор с Ольгой Ведерниковой, основательницей Эпсилон Метрикс
Мы с Женей (@zhenks_notes) продолжаем общаться с основателями российских стартапов в сфере геоинформатики, чтобы узнать их истории, и как в условиях текущей глобальной турбулентности они строят стратегии развития своих компаний. Прошлые интервью можно прочитать…
Послушала и очень рекомендую детальный и открытый разговор про OvertureMaps с их исполнительным директором.
Вот основные темы беседы:
1. Что такое OvertureMaps
2. Как устроены данные: иерархия источников достоверность
3.Для кого данные: как скачать, целевая аудитория, примеры использования
4. Сравнение с другими источниками ( OSM)
5. Особенности публикации открытых данных
6. Членство в OvertureMaps : зачем маленьким компаниям присоединяться
Вот основные темы беседы:
1. Что такое OvertureMaps
2. Как устроены данные: иерархия источников достоверность
3.Для кого данные: как скачать, целевая аудитория, примеры использования
4. Сравнение с другими источниками ( OSM)
5. Особенности публикации открытых данных
6. Членство в OvertureMaps : зачем маленьким компаниям присоединяться
Thegeomob
253. Marc Prioleau: Overture leaves beta
An update on the Overture Maps
Forwarded from Картетика.Канал
Картетика проводит исследование рынка труда гео-специалистов 📊
Мы продолжаем собирать информацию про нашу профессиональную деятельность. В прошлом году мы делали исследование гео-вакансий по данным HH. Но то, что пишут в резюме и вакансиях, только частично отражает общую картину.
Чтобы углубить наше знание о реальном положении дел, в этом году мы сделали свой опрос. Он для всех, кто причисляет себя к гео-специалистам 🗺
Примеры вопросов, на которые мы хотим и пытаемся найти ответы:
- какие зарплаты у нас в сфере
- какие навыки и ПО сейчас актуальны на рынке
- как много тех нас, кто работает на нескольких работах
- какая фактическая география нашего рынка труда
⚡️Как можно поучаствовать в исследовании:
- пройдите опрос самостоятельно, это займёт 7-10 минут
- поделитесь опросом с друзьями и коллегами, которые работают в нашей сфере
Чем больше ответов мы соберём, тем полнее и показательнее будут результаты💪🏻 Результаты опроса мы выложим открыто и добавим к ним свежие данные по вакансиям.
Мы продолжаем собирать информацию про нашу профессиональную деятельность. В прошлом году мы делали исследование гео-вакансий по данным HH. Но то, что пишут в резюме и вакансиях, только частично отражает общую картину.
Чтобы углубить наше знание о реальном положении дел, в этом году мы сделали свой опрос. Он для всех, кто причисляет себя к гео-специалистам 🗺
Примеры вопросов, на которые мы хотим и пытаемся найти ответы:
- какие зарплаты у нас в сфере
- какие навыки и ПО сейчас актуальны на рынке
- как много тех нас, кто работает на нескольких работах
- какая фактическая география нашего рынка труда
⚡️Как можно поучаствовать в исследовании:
- пройдите опрос самостоятельно, это займёт 7-10 минут
- поделитесь опросом с друзьями и коллегами, которые работают в нашей сфере
Чем больше ответов мы соберём, тем полнее и показательнее будут результаты💪🏻 Результаты опроса мы выложим открыто и добавим к ним свежие данные по вакансиям.
Месяц назад Яндекс запустил свою геоаналитическую платформу, и у меня получилось пообщаться с одним из ее аналитиков, Арсланом (@ars_gaz).
Арслан учился во 2-ом потоке моего курса, поэтому помимо инсайтов про платформу, он поделился еще своим опытом перехода от учебных задач к практическим в большой компании. Кажется, получилось интересно.
Читать тут👀
Арслан учился во 2-ом потоке моего курса, поэтому помимо инсайтов про платформу, он поделился еще своим опытом перехода от учебных задач к практическим в большой компании. Кажется, получилось интересно.
Читать тут👀
Telegraph
Интервью с аналитиком платформы Геоаналитики Яндекс Карт
Сегодня мы общаемся с Арсланом. Он аналитик, сейчас работает в Яндексе в команде Геоаналитики Яндекс Карт . Познакомились мы с Арсланом полтора года назад, когда он проходил мой курс по пространственному анализу. Арслан, привет. Привет. Расскажи, чем ты…
Forwarded from Arina
Вакансия: Геоаналитик в команду доставки ВкусВилла 🥑
Всем привет!
Ищем геоаналитика в команду доставки ВкусВилла. Мы открыты к творческим и инициативным людям, готовым развивать доставку вместе с нами!
Какие задачи вас ждут:
🔴 Анализ и решение исследовательских задач для бизнеса на основе геоданных с применением методов геостатистики;
🔴 Поиск пространственных зависимостей в данных;
🔴 Подготовка автоматических геоаналитических отчетов;
🔴 Продуктивизация сервиса и внедрение аналитических решений;
🔴 Выполнение множества ad hoc запросов от смежных команд.
Мы ждем вас, если вы:
🔴 Уверенно владеете Python и основными библиотеками для анализа (гео)данных (например, (geo)Pandas, Folium, NumPy, Scikit-learn и др.), а также SQL и QGIS/ArcGIS;
🔴 Понимаете, как работают алгоритмы классического машинного обучения и имеете опыт их применения;
🔴 Понимаете основы статистики и умеете применять их на практике;
🔴 Владеете инструментами автоматической отчетности, такими как Power BI.
Отправляйте резюме и задавайте вопросы Арине @arirrr
Очень ждем и будем рады обмениваться опытом❤️
Всем привет!
Ищем геоаналитика в команду доставки ВкусВилла. Мы открыты к творческим и инициативным людям, готовым развивать доставку вместе с нами!
Какие задачи вас ждут:
Мы ждем вас, если вы:
Отправляйте резюме и задавайте вопросы Арине @arirrr
Очень ждем и будем рады обмениваться опытом
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from ХЗ Инфо | Карты и статистика
🛜 Страны мира с наибольшим числом людей, лишенных доступа к интернету
Индия лидирует по числу людей, не имеющих доступа к интернету – 684 миллиона (48% населения страны). На втором месте – Китай, где вне сети остаются 336 миллионов человек (24%).
В Африке наибольшая доля населения без интернета зафиксирована в Эфиопии – 81%, в Уганде – 73%, а в Демократической Республике Конго – 71%. В Танзании, Нигерии и Бангладеш около 55% населения также не подключены к сети.
Основные причины такого разрыва – недостаток инфраструктуры, высокая стоимость подключения и бедность, особенно в сельской местности.
Индия лидирует по числу людей, не имеющих доступа к интернету – 684 миллиона (48% населения страны). На втором месте – Китай, где вне сети остаются 336 миллионов человек (24%).
В Африке наибольшая доля населения без интернета зафиксирована в Эфиопии – 81%, в Уганде – 73%, а в Демократической Республике Конго – 71%. В Танзании, Нигерии и Бангладеш около 55% населения также не подключены к сети.
Основные причины такого разрыва – недостаток инфраструктуры, высокая стоимость подключения и бедность, особенно в сельской местности.
Я тут осознала, что очень отстала от жизни. Почему? Потому что до Гошиного поста про новую Urban Foundation Model от Google, никогда про них не слышала - а судя по этой статье, за последние 2 года их популярность стремительно набирает обороты, и есть уже модели под самые различные задачи от прогноза загруженности дорог до анализа потребления электричества. Точнее их прелесть в том, что одна такая модель может помочь решить обе задачи, и еще пару 10тков других.
Вобщем, я очень эксайтед попробовать дообучить одну из таких моделей либо под рабочую, либо под PhD задачу, но это займет время. Поэтому пока написала открытый пост у себя в boosty с тем, чтобы немного разобраться в концепции foundation models в гео.
И да, если у кого-то есть опыт разработки или использования такой модели, поделитесь. Очень интересно
Вобщем, я очень эксайтед попробовать дообучить одну из таких моделей либо под рабочую, либо под PhD задачу, но это займет время. Поэтому пока написала открытый пост у себя в boosty с тем, чтобы немного разобраться в концепции foundation models в гео.
И да, если у кого-то есть опыт разработки или использования такой модели, поделитесь. Очень интересно
Forwarded from Geoalert Blog
While there is a constantly growing number of publications about the integration of large models (#LLMs, Visual language models) with spatial apps—both academic and marketing 😎 — we added our two bits from solving real business cases.
Next time you see a lot of comments under another LinkedIn post featuring #geoai and #arcgis as a game changer of this integration, take a deep breath and remind yourself about hitting the target. 😃
Next time you see a lot of comments under another LinkedIn post featuring #geoai and #arcgis as a game changer of this integration, take a deep breath and remind yourself about hitting the target. 😃
Forwarded from Gleb Romanov
Ребята привет! Ищем геоаналитика в юнит открытий ПВЗ компании Wildberries.
Задача команды геоаналитики - понимать, сколько мы хотим открывать ПВЗ и в каких местах + как смотивировать собственников на открытие именно в нужной для нас точке. Продукт, который служит достижению этой цели - карта открытий (часть алгоритмов под капотом этой карты написала команда геоаналитики).
Цель по открытиям достигается через набор моделей (предсказание оборота старых и новых ПВЗ, перегруза, вероятности открытия, расходов и доходов собственника и ВБ и других).
Вам предстоит заниматься как написанием новых и развитием существующих моделей (выдвижение гипотез, построение фичей и таргета, анализ результата и корректировка модели, построение финального пайплайна), так и ad hoc запросами от бизнеса (пример: проанализировать распределение оборотов в малых городах стран СНГ, подготовить предложения по изменению параметров зон карты в этих городах, защитить результат перед бизнесом).
Мы ожидаем, что у вас есть:
* Уровень от middle и выше (3+ года в программировании и QGIS - каждом по отдельности);
* Опыт работы с python (geopandas), PostGIS, QGIS;
* Знание и практическое применение мат. статистики и алгоритмов ML;
* Самостоятельность (готовность понять проблему заказчика и преобразовать в техническое решение);
* Интерес к геоаналитике, желание развиваться в этой сфере;
* Будет плюсом опыт в: osmnx, networkx, momepy.
Мы предлагаем:
* Сложные интересные исследовательские задачи, менторство и команду аналитиков, которым не всё равно;
* Гибридный формат работы в Москве (2 раза в неделю встречаемся в офисе на м. Тульская);
Для связи пишите Виктории @VSH_job (скажите, что пришли через канал Инессы Трегубовой - ребята с такой рекомендацией проходят облегчённый первичный скриннинг)
Задача команды геоаналитики - понимать, сколько мы хотим открывать ПВЗ и в каких местах + как смотивировать собственников на открытие именно в нужной для нас точке. Продукт, который служит достижению этой цели - карта открытий (часть алгоритмов под капотом этой карты написала команда геоаналитики).
Цель по открытиям достигается через набор моделей (предсказание оборота старых и новых ПВЗ, перегруза, вероятности открытия, расходов и доходов собственника и ВБ и других).
Вам предстоит заниматься как написанием новых и развитием существующих моделей (выдвижение гипотез, построение фичей и таргета, анализ результата и корректировка модели, построение финального пайплайна), так и ad hoc запросами от бизнеса (пример: проанализировать распределение оборотов в малых городах стран СНГ, подготовить предложения по изменению параметров зон карты в этих городах, защитить результат перед бизнесом).
Мы ожидаем, что у вас есть:
* Уровень от middle и выше (3+ года в программировании и QGIS - каждом по отдельности);
* Опыт работы с python (geopandas), PostGIS, QGIS;
* Знание и практическое применение мат. статистики и алгоритмов ML;
* Самостоятельность (готовность понять проблему заказчика и преобразовать в техническое решение);
* Интерес к геоаналитике, желание развиваться в этой сфере;
* Будет плюсом опыт в: osmnx, networkx, momepy.
Мы предлагаем:
* Сложные интересные исследовательские задачи, менторство и команду аналитиков, которым не всё равно;
* Гибридный формат работы в Москве (2 раза в неделю встречаемся в офисе на м. Тульская);
Для связи пишите Виктории @VSH_job (скажите, что пришли через канал Инессы Трегубовой - ребята с такой рекомендацией проходят облегчённый первичный скриннинг)
# PhD #mobiledata
Давно не было тут новостей про мой PhD, а работа тем временем кипит. Я завела проект на гитхаб, где можно следить за работой:)
Теперь пара слов о том, что я делаю.
В работе я исследую влияние удаленной работы на экономику городских районов. Моя гипотеза в том, что люди, которые часть времени работают из дома стали менее чувствительны к времени, которое заменяет дорога на работу, но при этом больше обращают внимание на доступность сервисов, кафе, магазинов вокруг дома. И такое поведение меняет экономику городских районов.
Свою гипотезу я проверяю на центральном районе Израиля, где большинство рабочих мест и развлечений сосредоточено в Тель-Авиве, а спальные кварталы расположены вокруг, в городах-спутниках.
Так вот, за последние два месяца я сделала первые шаги для того, чтобы оценить долю удаленьщиков в кварталах городов центра Израиля. Точнее измерить как менялся ее уровень с 2019 по 2023 год.
Мне повезло получить данные о GPS-локациях от компании Habidatum, поэтому измерения я делаю на мобильных сигналах, что должно дать мне результат более точный, чем опросы.
Почему "первые шаги"? Потому что с учётом размера данных каждый месяц приходится обрабатывать по-отдельности и потому что оценка удаленки оказалась не такой простой, как в теории. Пока я научилась с уверенностью находить дом и работу юзеров на каждый месяц данных- это было тоже непросто. Код можно найти на гитхаб, большой текст про подход у меня в бусти.
Знаю, что большинство читать не будут), поэтому кратко тут:
- правила о времени и частоте сигналов дома и на работе сработали лучше кластеризации;
- сначала пришлось найти дом и из оставшихся локаций работу;
- корреляция домашних локаций с населением 0.65
- ошибка первого рода рабочих локаций и официальных рабочих зон 4%.
Про так, как в итоге получилось посчитать долю работы из дома, напишу в следующих постах. А пока, можете пожелать мне удачи😊
Давно не было тут новостей про мой PhD, а работа тем временем кипит. Я завела проект на гитхаб, где можно следить за работой:)
Теперь пара слов о том, что я делаю.
В работе я исследую влияние удаленной работы на экономику городских районов. Моя гипотеза в том, что люди, которые часть времени работают из дома стали менее чувствительны к времени, которое заменяет дорога на работу, но при этом больше обращают внимание на доступность сервисов, кафе, магазинов вокруг дома. И такое поведение меняет экономику городских районов.
Свою гипотезу я проверяю на центральном районе Израиля, где большинство рабочих мест и развлечений сосредоточено в Тель-Авиве, а спальные кварталы расположены вокруг, в городах-спутниках.
Так вот, за последние два месяца я сделала первые шаги для того, чтобы оценить долю удаленьщиков в кварталах городов центра Израиля. Точнее измерить как менялся ее уровень с 2019 по 2023 год.
Мне повезло получить данные о GPS-локациях от компании Habidatum, поэтому измерения я делаю на мобильных сигналах, что должно дать мне результат более точный, чем опросы.
Почему "первые шаги"? Потому что с учётом размера данных каждый месяц приходится обрабатывать по-отдельности и потому что оценка удаленки оказалась не такой простой, как в теории. Пока я научилась с уверенностью находить дом и работу юзеров на каждый месяц данных- это было тоже непросто. Код можно найти на гитхаб, большой текст про подход у меня в бусти.
Знаю, что большинство читать не будут), поэтому кратко тут:
- правила о времени и частоте сигналов дома и на работе сработали лучше кластеризации;
- сначала пришлось найти дом и из оставшихся локаций работу;
- корреляция домашних локаций с населением 0.65
- ошибка первого рода рабочих локаций и официальных рабочих зон 4%.
Про так, как в итоге получилось посчитать долю работы из дома, напишу в следующих постах. А пока, можете пожелать мне удачи😊
Если вам вдруг станет скучно отдыхать на выходных, рекомендую почитать посты на этом ресурсе.
Авторы, 3 профессора из университетов США и Испании, разбирают академические статьи ( в основном behavioral science) с целью поиска в них фрода при работе с данными. Они пытаются повторить шаги исследователей на расширенной выборке или другими стат методами и проверить получается ли такой же результат как в статье. Один из авторов подал на них в суд иск на 25млн долларов - так что все серьезно:)
На мой взгляд очень полезное чтение с точки зрения понимания подводных камней при разработке дизайна исследования.
Авторы, 3 профессора из университетов США и Испании, разбирают академические статьи ( в основном behavioral science) с целью поиска в них фрода при работе с данными. Они пытаются повторить шаги исследователей на расширенной выборке или другими стат методами и проверить получается ли такой же результат как в статье. Один из авторов подал на них в суд иск на 25млн долларов - так что все серьезно:)
На мой взгляд очень полезное чтение с точки зрения понимания подводных камней при разработке дизайна исследования.