Telegram Group Search
Недавно закончился 4- ый поток моего курса, поэтому время публиковать финальные проекты слушателей. Первый раз на моем курсе часть проектов была выполнена по запросу бизнес- заказчиков.

Юля Васильева(@Yulia_Yadrikhinskaya) сделала проект по рекомендации локаций для агентства среднесрочной аренды квартир в Тель-Авиве Midterm Dan.
Какие данные и подходы она использовала, а также какие результаты получила, читайте по ссылке
По окончании курса слушатели не только делают проекты, но некоторые еще и дорабатывают библиотеки python, которые мы на курсе проходим.

Ниже пост от Максима, слушателя 3-ьего потока, который сделал свой extension к модели regression kriging- регрессионной модели усиленной с помощью пространственной модели, кригинг .
Forwarded from Максим К.
Привет! 🌏 Сегодня немного о кригинге.

Кригинг - это метод интерполяции. Он полезен при работе с данными, которые имеют неравномерное распределение или пропуски, и позволяет создавать карты с плавными переходами и естественными градиентами. 🔍

Основное преимущество кригинга заключается в его способности учитывать пространственные корреляции между точками данных, что обеспечивает более точные и надежные результаты по сравнению с другими методами интерполяции. ⚖️

🌟 Ниже небольшой, но мощный Python-класс, который соединил в себе силу регрессионных моделей и кригинга! 📊🌎
https://github.com/redsun1988/KreegingGridSearchCv/tree/master
Этот класс совместим со sklearn и позволяет легко интегрировать его c различными регрессионными моделями. А функция кригинга, поможет уменьшить ошибку предсказывая в областях, где информация отсутствует или ограничена.

Главная его особенность - возможность подбора оптимальных мета параметров для регрессионных моделей и кригинга с помощью GridSearchCv. Это позволяет экспериментировать с различными конфигурациями и находить наиболее подходящую модель для ваших данных.

Хотите больше узнать о Кригинге?
Вот ссылка на книгу Fifty Years of Kriging
Несколько около гео data science позиций в Лондоне и на Кипре в Wheely. За референсом пишите @mann_sarah
Ссылка
Со временем все больше убеждаюсь, что важным компонентом анализа городских данных является понимание основ устройства города: экономических, социальных, экологических, правовых и тд. Поэтому тем, кто как и я, пришел в сферу из дата аналитики, рекомендую присмотреться к новости ниже.

P.S. Я пожертвовала вечером выходного и записалась на теорию социологии города к Петру)


Онлайн-школа урбанистики и городских исследований
«Города» открывает новый поток обучения!

Миссия этого проекта — делиться знаниями в сфере урбанистики и городских исследований, объединять единомышленников и развивать сообщество урбанистов, архитекторов, градостроителей, управленцев, культурологов и активных горожан.

Преподаватели Школы — известные в своих сферах специалисты, которые получили знания в полях и создали авторские курсы. Программы будут интересны как профессионалам, так и тем, кто только начинает погружаться в сферу урбанистики.

«География для архитекторов» от главного редактора журнала «Экоурбанист» Ольги Максимовой, «Социальное проектирование в малых городах» от культуролога и социального антрополога Дмитрия Лисицина, первый в России онлайн-курс по созданию дог-френдли среды от автора проекта «Собакин город» Артёма Гебелева — в новом потоке Школы 8 курсов, а ещё — медленный книжный клуб, где вместе с единомышленниками можно будет обсудить интересные книги по урбанистике.

📌Подробнее прочитать о курсах и записаться вы можете на сайте Школы: https://gorodaschool.ru/. Приглашаем!
Тот случай, когда и аналитиком быть не надо)) Обычно говорят "как грибов", теперь буду говорить "Как McDonald's". Не знаю, к сожалению, источник картинки
Не столько про данные, сколько про хорошее и полезное исследование для горожан:

Редакторское бюро «Гладлакс» выпустило спецпроект о том, как пешеходам оставаться в безопасности на дорогах.

В статье приведены цифры (данные ГИБДД, могут содержать неточности) и свидетельства, которые, к сожалению, потверждают, что пешеход всегда в зоне риска и нужно оставаться бдительными.

Из того, что зацепило меня:

- в октябре и ноябре происходит больше всего дорожных аварий с участием пешеходов ( удивляет правда, что только 7% аварий без пешеходов)

- Почти треть от всех ДТП в России за 2023 год произошла именно с пешеходами

- Среди смертельных случаев в 3 из 4 раз виноват пешеход

- авторы подтверждают, что ошибки проектирования повышают риск аварий, включая смертельные
Мы с Женей (@zhenks_notes) продолжаем общаться с основателями российских стартапов в сфере геоинформатики, чтобы узнать их истории, и как в условиях текущей глобальной турбулентности они строят стратегии развития своих компаний.

В этот раз мы общались с Ольгой Ведерниковой, основательницей геоаналитической платформы Эпсилон Метрикс. От Оли мы узнали, что значит развивать геоаналитическую платформу сегодня на российском рынке и как происходит трансформация из менеджера банка в основателя стартапа. Прочитать краткую версию нашего разговора можно тут
Послушала и очень рекомендую детальный и открытый разговор про OvertureMaps с их исполнительным директором.

Вот основные темы беседы:

1. Что такое OvertureMaps

2. Как устроены данные: иерархия источников достоверность

3.Для кого данные: как скачать, целевая аудитория, примеры использования

4. Сравнение с другими источниками ( OSM)

5. Особенности публикации открытых данных

6. Членство в OvertureMaps : зачем маленьким компаниям присоединяться
Картетика проводит исследование рынка труда гео-специалистов 📊

Мы продолжаем собирать информацию про нашу профессиональную деятельность. В прошлом году мы делали исследование гео-вакансий по данным HH. Но то, что пишут в резюме и вакансиях, только частично отражает общую картину.

Чтобы углубить наше знание о реальном положении дел, в этом году мы сделали свой опрос. Он для всех, кто причисляет себя к гео-специалистам 🗺

Примеры вопросов, на которые мы хотим и пытаемся найти ответы:
- какие зарплаты у нас в сфере
- какие навыки и ПО сейчас актуальны на рынке
- как много тех нас, кто работает на нескольких работах
- какая фактическая география нашего рынка труда

⚡️Как можно поучаствовать в исследовании:
- пройдите опрос самостоятельно, это займёт 7-10 минут
- поделитесь опросом с друзьями и коллегами, которые работают в нашей сфере

Чем больше ответов мы соберём, тем полнее и показательнее будут результаты💪🏻 Результаты опроса мы выложим открыто и добавим к ним свежие данные по вакансиям.
Месяц назад Яндекс запустил свою геоаналитическую платформу, и у меня получилось пообщаться с одним из ее аналитиков, Арсланом (@ars_gaz).

Арслан учился во 2-ом потоке моего курса, поэтому помимо инсайтов про платформу, он поделился еще своим опытом перехода от учебных задач к практическим в большой компании. Кажется, получилось интересно.

Читать тут👀
Forwarded from Arina
Вакансия: Геоаналитик в команду доставки ВкусВилла 🥑

Всем привет!
Ищем геоаналитика в команду доставки ВкусВилла. Мы открыты к творческим и инициативным людям, готовым развивать доставку вместе с нами!

Какие задачи вас ждут:
🔴Анализ и решение исследовательских задач для бизнеса на основе геоданных с применением методов геостатистики;
🔴Поиск пространственных зависимостей в данных;
🔴Подготовка автоматических геоаналитических отчетов;
🔴Продуктивизация сервиса и внедрение аналитических решений;
🔴Выполнение множества ad hoc запросов от смежных команд.

Мы ждем вас, если вы:
🔴Уверенно владеете Python и основными библиотеками для анализа (гео)данных (например, (geo)Pandas, Folium, NumPy, Scikit-learn и др.), а также SQL и QGIS/ArcGIS;
🔴Понимаете, как работают алгоритмы классического машинного обучения и имеете опыт их применения;
🔴Понимаете основы статистики и умеете применять их на практике;
🔴Владеете инструментами автоматической отчетности, такими как Power BI.

Отправляйте резюме и задавайте вопросы Арине @arirrr
Очень ждем и будем рады обмениваться опытом ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
🛜 Страны мира с наибольшим числом людей, лишенных доступа к интернету

Индия лидирует по числу людей, не имеющих доступа к интернету – 684 миллиона (48% населения страны). На втором месте – Китай, где вне сети остаются 336 миллионов человек (24%).

В Африке наибольшая доля населения без интернета зафиксирована в Эфиопии – 81%, в Уганде – 73%, а в Демократической Республике Конго – 71%. В Танзании, Нигерии и Бангладеш около 55% населения также не подключены к сети.

Основные причины такого разрыва – недостаток инфраструктуры, высокая стоимость подключения и бедность, особенно в сельской местности.
Я тут осознала, что очень отстала от жизни. Почему? Потому что до Гошиного поста про новую Urban Foundation Model от Google, никогда про них не слышала - а судя по этой статье, за последние 2 года их популярность стремительно набирает обороты, и есть уже модели под самые различные задачи от прогноза загруженности дорог до анализа потребления электричества. Точнее их прелесть в том, что одна такая модель может помочь решить обе задачи, и еще пару 10тков других.

Вобщем, я очень эксайтед попробовать дообучить одну из таких моделей либо под рабочую, либо под PhD задачу, но это займет время. Поэтому пока написала открытый пост у себя в boosty с тем, чтобы немного разобраться в концепции foundation models в гео.

И да, если у кого-то есть опыт разработки или использования такой модели, поделитесь. Очень интересно
в тему foundation models
Forwarded from Geoalert Blog
While there is a constantly growing number of publications about the integration of large models (#LLMs, Visual language models) with spatial apps—both academic and marketing 😎we added our two bits from solving real business cases.
Next time you see a lot of comments under another LinkedIn post featuring #geoai and #arcgis as a game changer of this integration, take a deep breath and remind yourself about hitting the target. 😃
Forwarded from Gleb Romanov
Ребята привет! Ищем геоаналитика в юнит открытий ПВЗ компании Wildberries.

Задача команды геоаналитики - понимать, сколько мы хотим открывать ПВЗ и в каких местах + как смотивировать собственников на открытие именно в нужной для нас точке. Продукт, который служит достижению этой цели - карта открытий (часть алгоритмов под капотом этой карты написала команда геоаналитики).
Цель по открытиям достигается через набор моделей (предсказание оборота старых и новых ПВЗ, перегруза, вероятности открытия, расходов и доходов собственника и ВБ и других).
Вам предстоит заниматься как написанием новых и развитием существующих моделей (выдвижение гипотез, построение фичей и таргета, анализ результата и корректировка модели, построение финального пайплайна), так и ad hoc запросами от бизнеса (пример: проанализировать распределение оборотов в малых городах стран СНГ, подготовить предложения по изменению параметров зон карты в этих городах, защитить результат перед бизнесом).

Мы ожидаем, что у вас есть:
* Уровень от middle и выше (3+ года в программировании и QGIS - каждом по отдельности);
* Опыт работы с python (geopandas), PostGIS, QGIS;
* Знание и практическое применение мат. статистики и алгоритмов ML;
* Самостоятельность (готовность понять проблему заказчика и преобразовать в техническое решение);
* Интерес к геоаналитике, желание развиваться в этой сфере;
* Будет плюсом опыт в: osmnx, networkx, momepy.

Мы предлагаем:
* Сложные интересные исследовательские задачи, менторство и команду аналитиков, которым не всё равно;
* Гибридный формат работы в Москве (2 раза в неделю встречаемся в офисе на м. Тульская);

Для связи пишите Виктории @VSH_job (скажите, что пришли через канал Инессы Трегубовой - ребята с такой рекомендацией проходят облегчённый первичный скриннинг)
​​# PhD #mobiledata

Давно не было тут новостей про мой PhD, а работа тем временем кипит. Я завела проект на гитхаб, где можно следить за работой:)

Теперь пара слов о том, что я делаю.

В работе я исследую влияние удаленной работы на экономику городских районов. Моя гипотеза в том, что люди, которые часть времени работают из дома стали менее чувствительны к времени, которое заменяет дорога на работу, но при этом больше обращают внимание на доступность сервисов, кафе, магазинов вокруг дома. И такое поведение меняет экономику городских районов.

Свою гипотезу я проверяю на центральном районе Израиля, где большинство рабочих мест и развлечений сосредоточено в Тель-Авиве, а спальные кварталы расположены вокруг, в городах-спутниках.

Так вот, за последние два месяца я сделала первые шаги для того, чтобы оценить долю удаленьщиков в кварталах городов центра Израиля. Точнее измерить как менялся ее уровень с 2019 по 2023 год.

Мне повезло получить данные о GPS-локациях от компании Habidatum, поэтому измерения я делаю на мобильных сигналах, что должно дать мне результат более точный, чем опросы.

Почему "первые шаги"? Потому что с учётом размера данных каждый месяц приходится обрабатывать по-отдельности и потому что оценка удаленки оказалась не такой простой, как в теории. Пока я научилась с уверенностью находить дом и работу юзеров на каждый месяц данных- это было тоже непросто. Код можно найти на гитхаб, большой текст про подход у меня в бусти.

Знаю, что большинство читать не будут), поэтому кратко тут:
- правила о времени и частоте сигналов дома и на работе сработали лучше кластеризации;
- сначала пришлось найти дом и из оставшихся локаций работу;
- корреляция домашних локаций с населением 0.65
- ошибка первого рода рабочих локаций и официальных рабочих зон 4%.

Про так, как в итоге получилось посчитать долю работы из дома, напишу в следующих постах. А пока, можете пожелать мне удачи😊
Если вам вдруг станет скучно отдыхать на выходных, рекомендую почитать посты на этом ресурсе.

Авторы, 3 профессора из университетов США и Испании, разбирают академические статьи ( в основном behavioral science) с целью поиска в них фрода при работе с данными. Они пытаются повторить шаги исследователей на расширенной выборке или другими стат методами и проверить получается ли такой же результат как в статье. Один из авторов подал на них в суд иск на 25млн долларов - так что все серьезно:)

На мой взгляд очень полезное чтение с точки зрения понимания подводных камней при разработке дизайна исследования.
2025/01/07 00:06:37
Back to Top
HTML Embed Code: