Telegram Group Search
Как-то мало в медиа-пространстве говорят про Форест. А тем временем они набирают 2 очка за игру и после 20 туров идут на втором месте.

На чемпионство, конечно, не претендуют(как любая команда, название которой не начинается с "Ливерпул"), но к середине сезона главную задачу на него (не вылететь) уже решили.

Забавный факт: за 20 туров этого сезона Форест набрал больше очков, чем в каждом из двух предыдущих сезонов в АПЛ.

@number_in_sport
График Non-Penalty xG и xGA АПЛ после 20 туров.

На графике пространство разделено на 4 квадрата. В верхний попадают команды-лидеры (много создают, мало допускают), в нижний, наоброт, у кого всё плохо. Левый квадрат можно назвать «скучным», в нём команды у которых xG ниже среднего, а xGA выше (мало создают, мало допускают). В правом команды весёлые, которые много создают и много допускают.

Ливерпуль заслуженный лидер: лучшая атака (с отрывом), вторая оборона. Были на острие зелёного квадрата, но игра с МЮ отбросила xGA от показателя Арсенала.
• У Арсенала лучшая оборона, но лишь седьмая атака. Если посчитать NPxG только с игры, ситуация будет ещё хуже.
Форест своим вторым местом обязан защите (допускают всего 1.02 xGA, меньше только Арсенал и Ливерпуль) и удаче (Форест 15-ый по xG и имеет разницу всего +0.17. У Арсенала +0.81, у Ливерпуля +1.24).

Ставьте реакции, если график был интересен, тогда сделаю такие же по остальным 4 лигам Большой пятёрки.

@number_in_sport
Цифры в спорте
График Non-Penalty xG и xGA АПЛ после 20 туров. На графике пространство разделено на 4 квадрата. В верхний попадают команды-лидеры (много создают, мало допускают), в нижний, наоброт, у кого всё плохо. Левый квадрат можно назвать «скучным», в нём команды у…
Продолжение.
МС, несмотря на все проблемы, в зелёной зоне. Правда соседствует не с Ливерпулем или Арсеналом, а с Ньюкаслом и Бормутом.
• Новички дружным трио в двух зонах: фиолетовой на графике и вылета в таблице. ВХЮ, наверное, тоже не ожидал такого места от союза с Лопетеги.
ТТХ в одиночестве в «весёлом» квадрате. Постекоглу и здесь решил выделится.
МЮ в кластере из 3 команд: Брайтоном, у которого дела получше, и Кристал Пэласом, у которого дела похуже. Но вцелом вполне заслуженное место во второй половине таблицы.

@number_in_sport
Судя по Вашим реакциям график был полезен, поэтому сделаю и остальные 4 лиги из Big 5.

Италия


• Италия единственная Лига из пяти, в которой нет ни одной команды с 2 NPxG и всего 2 команды с xG больше 1.5.
• Эти две команды Интер и Аталанта. Они занимают первые два места по xG и 3-4 по xGA. Бергамаски рядом с «командой будущего», но по каждому показателю немного хуже.
Ювентус и Наполи тоже похожи. Две лучшие обороны, атака в топ-6. Но несмотря на высокое место, атака вызывает вопросы: 1.3 xG не поражает воображение, а отставание от Интера почти полгола (0.4 xG).
• Глядя на график не скажешь, что Милан дошёл до увольнения тренера. Красно-чёрные в середине зелёного квадрата, с третьей атакой и восьмой обороной.
• В Серии А нет команд в правом квадрате, но на роль «весельчака» может претендовать Кальяри: 8 место по xG (выше Фиорентины), 18 по xGA.

@number_in_sport
Цифры в спорте
Судя по Вашим реакциям график был полезен, поэтому сделаю и остальные 4 лиги из Big 5. Италия • Италия единственная Лига из пяти, в которой нет ни одной команды с 2 NPxG и всего 2 команды с xG больше 1.5. • Эти две команды Интер и Аталанта. Они занимают…
Продолжение.
Комо держится рядом с Фиорентиной и Болоньей, но только на этом графике. Если случится регрессия к среднему, то команда с прекрасного озера может хорошо подняться во втором круге.
• В нижней части Венеция, Лечче, Верона и Парма. Последние явные аутсайдеры в плане обороны: допускают на 0.26 xGA больше, чем 19-ое место.

@number_in_sport
На очереди Германия

Бавария, как и ПСЖ во Франции, находится на «краю света»: мюнхенцы больше всех создают и меньше всех допускают. Если по xG в оносительной близости есть Айнтрахт (2.05 — 1.85), то по xGA отрыв от второго места почти двукратный (0.54 у Баварии, 1 xGA у Байера).
Байер не сумел сохранить прошлогоднее везение, но качество игры осталось на уровне. Леверкузен в «зелёной» зоне, с третьей атакой и второй защитой.
Боруссия вроде как тоже в зелёном квадрате, но по статистике гораздо ближе к Фрайбургу и Майнцу, чем к Баварии и Байеру.
• Бундеслига поддерживает звание «весёлого» чемпионата. В 4 остальных лигах только ТТХ попал в правый, «весёлый», квадрат. В Германии таких команд 4, плюс несколько на грани перехода в него. В левом, «скучном», квадрате одинокий Унион.
Бохум и Хольштейн и на графике заметно хуже остальных. Первые допускают на 0.35 xGA остальных, вторые 18-ые по xG 17-ые по xGA. Получается "Чудо в Дюссельдорфе" просто продлило агонию Бохума.

@number_in_sport
Испания и Франция

График можно строить симметричным по осям координат или нет. Я строю симметричные оси (диапазон значений у осей одинаковый). Это честнее, но приводит к тому, что если есть команды-выброс, график становится одой этой команде, а для остальных теряет смысл.

Барселона (2.33 xG) опережает Атлетико на 0.73 xG, а ПСЖ (2.46 xG) Монако на 0.56 xG и на 0.85 Ниццу.
• Также никто столько не допускает моментов, сколько эти две команды создают (худший xGA в ЛаЛиге у Вальядолида 1.73, во Франции у Монпелье 1.68)
• Разница между Барселоной и Атлетико такая же, как между Атлетико и Осасуной, которая по xG занимает 15-ое место.
• ПСЖ, как и Бавария, лучшие и по xG, и по xGA.
• В Испании только Вальядолид своей слабой игрой в защите сумел заметно пролезть в фиолетовый квадрат. Во Франции все 16 команд, кроме ПСЖ и Монако, попали в левый квадрат.
• Результаты Марселя пока явно опережают их игру.

@number_in_sport
Ждём подписаний Уэйна Руни, Маруана Фелайни и Лейтона Бэйнса.
Гласбах может похвастаться самой дырявой обороной #прямосейчас. Пара фактов:

- За последние три игры в Бундеслиге Гласбах допустил у своих ворот 11.6 xGA. Бавария за весь свой сезон (16 игр) дала создать соперникам моментов на 9.9 xGA.
- Если отсортировать игры Баварии по xGA, то 11 игр с наименьшим xGA дают в сумме 3.6. Гласбах в каждой из последних двух игр дал соперникам создать больше (4.3 xGA против Баварии, 3.8 xGA против Вольфсбурга).
Всем привет.

Я знаю, что среди подписчиков канала есть люди, которые, как и я, занимаются программированием и анализом данных не только в виде хобби.
Поэтому если кто-то собирается на завтрашнюю оффлайн-часть Дата Ёлки 2024 в офис ВК, то мы могли бы встретиться и между докладами про компьютерное зрение, рекомендательные системы и т.п. поговорить и о DS/ML in sport.

Пишите мне в личку, ник в ТГ: @brains14482

https://ods.ai/events/data-elka-24-vk-offline
Набор данных для оценки 3D-поз на записях с ЧМ-2022 и соревнование Шрёдингера.

Исследователи из ETH Zurich выложили статью про WorldPose: новый датасет для оценки 3D поз человека. Почему эта новость здесь? Потому что 88 клипов, 150k кадров и 2.5 миллиона поз человека получены с ЧМ-2022. WorldPose, в отличии от других датасетов подобной тематики, которые обычно представляют дейсвия одного человека и/или в специальных помещениях, представляет динамические действия большого количества людей (10-20), которые одновременно находятся в кадре.

В статье рассказывается о процессе его создания (сборе данных с камер, их калибровке, разметке в 2D и т.д.). Качество сравнивали с данными от Vicon (система, когда человека обвешивают лампочками и он выглядит как ёлка) и получили хорошие результаты (средняя ошибка 8см.).

Проверили, как на WorldPose работают современные лучшие модели для оценки 3D поз. Результаты не очень, так что набор данных можно использовать как бенчмарк для дальнейшего улучшения качества моделей.

3D позиционирование может быть полезным в спортивной аналитике, а такой набор открытых (условно, об этом ниже) данных, вкупе с методикой его создания, даёт информацию для развития данного направления.

Теперь про "открытость" данных. Датасет предоставляется только по запросу к ETH Zurich через форму, но и это не всё. Т.к. видео файлы являются собственностью ФИФА, для их получения (ETH Zurich отдаёт только разметку) нужно отдельное согласие от них. Не сказать, чтобы у меня были технические возможности или скиллы, чтобы поработать с ними, но такой face control делает датасет почти закрытым.

Но это не всё. Вроде как на этих данных запущено открытое соревнование по ML. Почему вроде как? Потому что страница соревнования на сайте insideFIFA пропала, а из других упоминаний только html-страница WorldPose Challenge 2025 в гитхаб-репозитории проекта.

Сайт
Статья
Гитхаб

#soccer #data #3D #cv

@number_in_sport
Arsenal AI

Я иногда посматриваю на вакансии в спортивном data science. Не для того чтобы устроиться в Даллас Маверикс, сидя в провинциальном российском городе, а интереса ради. Вакансии встречаются разного типа, но такую я вижу в первый раз.

Арсенал ищет AI/Deep Learning Research Engineer для обучения/внедрения нейросеток, в т.ч. и LLM. Описание вакансии, как обычно в Европе, содержит много воды и "за всё хорошее против всего плохого", но если попытаться выжать суть, то требуется универсальный DL-солдат, который будет работать в различных доменах (текст, видео, изображения, геоданные, ну и таблички само собой) и внедрять весь этот ваш ИИ в аналитическую работу канониров. По описанию, похоже, что слово Research здесь не для красного словца: работа реально предполагает чтение статей и отслеживание SOTA (т.е. лучших) решений в индустрии.

Как обычно в иностранных вакансиях в требованиях перечислен весь стек DL-фреймворков (PyTorch, JAX, и даже, прости Господи, Tensorflow c Keras), так что непонятно, то ли Арсенал, в стиле БигТеха, смотрит не на знание конкретных фреймворков, а на общий инженерный уровень, то ли пока в этом направлении (DL/AI) у канониров ничего нет и поэтому на чём человек умеет писать, то и будет (так себе подход, ну да ладно).

На самом деле приятно видеть, что передовые команды стараются идти в ногу со временем и открывают такие вакансии с чёткими направлениями работы, а не "Нам нужен дата/BI/продукт аналитик с экспертным знанием машинного обучения, дата инженерии и фронтэнда за три копейки".

Вакансия
@number_in_sport
1/2
Тоттенхэм находится в очень тяжёлом положении: 15 место в АПЛ, 13 поражений в сезоне, семиматчевая серия без побед и кресло под тренером, как тот сентябрь.

На графике представлено 10-матчевое среднее по созданным (xG) и допущенным (xGA) угрозам без учёта пенальти у ТТХ в двух сезонах под руководством австралийца.

ТТХ в прошлом сезоне в этой же части сезона имел просадку по xG и взлёт xGA, что делало шпор «отрицательной» командой. Причём, в отличии этого года, у ТТХ не было матча с сумасшедшим выбросом (Ливерпуль, 5.6 npxGA). Можно сказать про травмы. Также, как и в этом году. Это так, но тут возникает вопросы в том числе и к тренеру, потому что «один раз — случайность, два — тенденция, три — закономерность». Но в целом ТТХ прошлого года был плюсовой командой, которая вышла на уровень 1.8 npxG за игру.

@numbers_in_sport
2/2
В этом году всё начиналось ещё лучше: ТТХ создавал в районе 2 xG, а разница между созданными и допущенными моментами была 0.82 xG. Но затем снова случился кризис. И беда даже не в том, что у ТТХ взлетела метрика xGA, это всего лишь влияние очень мощного выброса, а в том, что шпоры перестали создавать моменты. xG Тоттенхэма падает и сейчас достиг нижней точки за время работы Ангелоса. И, например, в дерби Северного Лондона были признаки того, что Постекоглу всё-таки прогнулся под «изменчивый мир», но без особого успеха.

Если отталкиваться только от результатов, то Постекоглу наработал на увольнение. Шутка ли, его ТТХ с начала прошлого года проиграл в АПЛ 25 раз. МЮ, который в жутком кризисе и чуть ли не одной ногой в пердиве чемпионшипе, проиграл за это время на одну игру меньше. С другой стороны, когда всё сходится в нужной точке, его Тоттенхэм претендент на нечто большОе.

@numbers_in_sport
Forwarded from Laptop Coach (Kirill Serykh)
Клоппи еще в декабре выкатил код для наших данных по 7 играм с синхронизацией трэкинга и ивентов от Кельнского спортивного университета. Авторы (Мануэль и Роберт) читают базовые курсы по данным у меня на программе, и они успели первыми выкатить синк по своему датасету быстрее - соберут больше цитирований) Наш алгоритм, который мы используем для Бундеслиги и МЛС один из моих коллег (собственно, автор, человек в одну каску делал его год) выложит позже, тому виной legals, возможные конфликты интересов и бюрократия)

Но теперь и статья, и данные доступны всем - так что если хочется поиграться с небольшим, но бесплатным объемом данных (и что-то интересное построить по ним - мы, кстати, скоро должны открыть и позицию на Data Science и какая-то работа по этим данным в паблике будет плюсом), есть отличный вариант.

https://github.com/PySport/kloppy/releases

https://www.nature.com/articles/s41597-025-04505-y
2025/02/05 23:55:53
Back to Top
HTML Embed Code: