В матче с МЮ была графика, что канониры не реализовали ни одного из 43 последних угловых, а до этой серии реализовывали каждый тринадцатый. Небольшая задачка на вероятности: какова вероятность не реализовать 43 угловых, если вероятность забить 1 из 13?
Anonymous Quiz
53%
3,2%
15%
5,6%
18%
0,5%
13%
12,3%
Скандалы, интриги, расследования в спортивной аналитике.
Команда МЛБ Филадельфия Филлис подала в суд на Zelus Analytics за то, что те нарушают условия контракта с командой и продают части своей платформы Titan Intelligence Platform её конкурентам по дивизиону.
Суть в следующем: по заключённым контрактам в 2022 и 2023 Zelus уже получили от Филы 1.75 М долларов (и получат 725 тысяч в этом году) в обменам на доступ к платформе TItan, аналитика и модели которой помогают командам в оценке игроков высшей и низших лиг бейсбола, заключении контрактов и выборе ростера (для бейсбола это важно, в зависимости от соперника и нагрузки на конкретных игроков девятка отбивающих может сильно меняться). В обмен на это Филадельфия получила эксклюзивное право на доступ в платформе в своём дивизионе NL East, и в целом возможности Zelus по продаже своей платформы ограничены правилом "1 дивизион - 1 команда". Zelus предлагали пересмотреть сделку, чтобы они могли продавать компоненты платформы всем командам МЛБ в обмен на снижение стоимости контракта для Филлис, но те отказались из-за нежелания терять конкурентное преимущество. После чего, судя по исковому заявлению команды, Zelus всё равно стали это делать в обход контракта.
С одной стороны мне очень не нравится такие "эксклюзивные" схемы - гораздо лучше, когда доступ к инструменту есть у всех команд Лиги и качество его использования зависит только от желания и дата-культуры. С другой, Zelus никто не заставлял подписывать такой контракт и уж если его подписали, то будьте добры исполнять. Что скажете?
Ссылка
@number_in_sport
Команда МЛБ Филадельфия Филлис подала в суд на Zelus Analytics за то, что те нарушают условия контракта с командой и продают части своей платформы Titan Intelligence Platform её конкурентам по дивизиону.
Суть в следующем: по заключённым контрактам в 2022 и 2023 Zelus уже получили от Филы 1.75 М долларов (и получат 725 тысяч в этом году) в обменам на доступ к платформе TItan, аналитика и модели которой помогают командам в оценке игроков высшей и низших лиг бейсбола, заключении контрактов и выборе ростера (для бейсбола это важно, в зависимости от соперника и нагрузки на конкретных игроков девятка отбивающих может сильно меняться). В обмен на это Филадельфия получила эксклюзивное право на доступ в платформе в своём дивизионе NL East, и в целом возможности Zelus по продаже своей платформы ограничены правилом "1 дивизион - 1 команда". Zelus предлагали пересмотреть сделку, чтобы они могли продавать компоненты платформы всем командам МЛБ в обмен на снижение стоимости контракта для Филлис, но те отказались из-за нежелания терять конкурентное преимущество. После чего, судя по исковому заявлению команды, Zelus всё равно стали это делать в обход контракта.
С одной стороны мне очень не нравится такие "эксклюзивные" схемы - гораздо лучше, когда доступ к инструменту есть у всех команд Лиги и качество его использования зависит только от желания и дата-культуры. С другой, Zelus никто не заставлял подписывать такой контракт и уж если его подписали, то будьте добры исполнять. Что скажете?
Ссылка
@number_in_sport
Front Office Sports
Phillies Try to Block NL East Rivals From Analytics Software
The Phillies claim Zelus Analytics is trying to breach their exclusivity contract by selling parts of their platform to other teams.
Как сделать интересной трансляцию Кубка Шотландии? Добавить всяких AI-штук.
Полуфиналы Кубка Шотландии вряд ли интересны большому числу людей за пределами самой Шотландии. Но Шотландская футбольная ассоциация совместно с Genuis Sports (компания по разработке спортивного ПО) представили новый вид трансляции — Tactical Cam. Название может путать, но это не трансляция игры с камеры, которая охватывает всё поле. Это обычная трансляция, но благодаря трекинг-камерам, расставленным по стадиону, её обогатили дополнительными примочками:
• Динамическая визуализация положения игроков на поле, как в футбольных симуляторах
• Подсветка фамилии игрока, владеющего мячом (опять же как в симуляторах)
• Скорость удара и подсветка его траектории
Всё это делается на платформе GeniusIQ, о чём напоминает довольно крупный баннер.
Полные записи двух игр (Селтик — Ст. Джонстон и Хартс — Абердин) выложены в открытый доступ на youtube-канале Кубка Шотландии.
С увеличением мощности технологий AI с одной стороны (модели могут решать всё большее число задач) и доступности с другой (с каждым поколением модели меньшего размера дают качество на уровне бОльших моделей предыдущего поколения) становится всё реальнее возможность давать разнообразную статистику и трекинг-данные в режиме реального времени. Вряд ли мы в скором времени увидим обычную трансляцию в таком режиме (не уверен, что простому болельщику всё это нужно), но, возможно, такие AI-трансляции будут идти как альтернативный каст.
Ссылка
@number_in_sport
Полуфиналы Кубка Шотландии вряд ли интересны большому числу людей за пределами самой Шотландии. Но Шотландская футбольная ассоциация совместно с Genuis Sports (компания по разработке спортивного ПО) представили новый вид трансляции — Tactical Cam. Название может путать, но это не трансляция игры с камеры, которая охватывает всё поле. Это обычная трансляция, но благодаря трекинг-камерам, расставленным по стадиону, её обогатили дополнительными примочками:
• Динамическая визуализация положения игроков на поле, как в футбольных симуляторах
• Подсветка фамилии игрока, владеющего мячом (опять же как в симуляторах)
• Скорость удара и подсветка его траектории
Всё это делается на платформе GeniusIQ, о чём напоминает довольно крупный баннер.
Полные записи двух игр (Селтик — Ст. Джонстон и Хартс — Абердин) выложены в открытый доступ на youtube-канале Кубка Шотландии.
С увеличением мощности технологий AI с одной стороны (модели могут решать всё большее число задач) и доступности с другой (с каждым поколением модели меньшего размера дают качество на уровне бОльших моделей предыдущего поколения) становится всё реальнее возможность давать разнообразную статистику и трекинг-данные в режиме реального времени. Вряд ли мы в скором времени увидим обычную трансляцию в таком режиме (не уверен, что простому болельщику всё это нужно), но, возможно, такие AI-трансляции будут идти как альтернативный каст.
Ссылка
@number_in_sport
YouTube
Scottish Gas Scottish Cup
Welcome to the official YouTube channel for the Scottish Gas Men's and Women's Scottish Cup competitions.
To licence Scottish Cup match footage, please contact IMG Replay: https://bit.ly/3EwnzZI
To licence Scottish Cup match footage, please contact IMG Replay: https://bit.ly/3EwnzZI
Forwarded from NBAatlantic
Карьерные сайты спортивных команд и лиг можно посещать не только с целью, чтобы подражая Биллу Симмонсу задавать себе вопрос «А что если?..», но и для получения инсайтов о целях и задачах в их (лиг и команд) развитии.
На карьерном сайте НБА сейчас открыта вакансия Machine Learning Engineer в команду Automated Officiating (давайте назовём её автоматизацией судейства). Так вот, этот инженер нанимается в первую очередь для того, чтобы автоматизировать судейские решения в ситуациях, которые предусматривают только бинарный ответ. В описании вакансии, как пример или реальная первостепенная задача, говорится об автоматической детекции заступов игроками за пределы площадки. НБА, как мне кажется, преследует две цели. Первая цель — снизить количество ошибок. Но для Лиги, думаю, важнее вторая часть — снизить количество судейских видеопросмотров, которые останавливают игру на несколько минут. В последнее время все американские Лиги пытаются уменьшить длительность игры и это шаг именно в этом направлении.
Сама вакансия интересная. Инженеру на этой должности нужно будет строить пайплайны всего жизненного цикла ML-моделей: от обработки данных со всевозможных сенсоров и камер, которыми утыканы арена клуба НБА, до поддержания её (модели) в работоспособном состоянии. В вакансии есть фокус на то, что данная команда — это стартап внутри компании, а это возможность оказывать существенное влияние на конечный продукт. С другой — это ограниченный ресурс, поэтому и поддерживать работу системы должен сам инженер, никакого DevOps не предусмотрено. Работать нужно будет как с потоковым видео, так и с данными от датчиков, поэтому в приоритете кандидаты, которые имеют такой опыт (например из роботехники или автопилотов). Объёмы данных большие, поэтому также плюсом будет умение работать с распределёнными системами. В самой вакансии неплохо расписаны задачи и требования, а также необходимый стек технологий.
Ссылка
@nbaatlantic
На карьерном сайте НБА сейчас открыта вакансия Machine Learning Engineer в команду Automated Officiating (давайте назовём её автоматизацией судейства). Так вот, этот инженер нанимается в первую очередь для того, чтобы автоматизировать судейские решения в ситуациях, которые предусматривают только бинарный ответ. В описании вакансии, как пример или реальная первостепенная задача, говорится об автоматической детекции заступов игроками за пределы площадки. НБА, как мне кажется, преследует две цели. Первая цель — снизить количество ошибок. Но для Лиги, думаю, важнее вторая часть — снизить количество судейских видеопросмотров, которые останавливают игру на несколько минут. В последнее время все американские Лиги пытаются уменьшить длительность игры и это шаг именно в этом направлении.
Сама вакансия интересная. Инженеру на этой должности нужно будет строить пайплайны всего жизненного цикла ML-моделей: от обработки данных со всевозможных сенсоров и камер, которыми утыканы арена клуба НБА, до поддержания её (модели) в работоспособном состоянии. В вакансии есть фокус на то, что данная команда — это стартап внутри компании, а это возможность оказывать существенное влияние на конечный продукт. С другой — это ограниченный ресурс, поэтому и поддерживать работу системы должен сам инженер, никакого DevOps не предусмотрено. Работать нужно будет как с потоковым видео, так и с данными от датчиков, поэтому в приоритете кандидаты, которые имеют такой опыт (например из роботехники или автопилотов). Объёмы данных большие, поэтому также плюсом будет умение работать с распределёнными системами. В самой вакансии неплохо расписаны задачи и требования, а также необходимый стек технологий.
Ссылка
@nbaatlantic
NBA
Machine Learning Engineer - Automated Officiating in New York, NY, United States | Technology at NBA
Apply for Machine Learning Engineer - Automated Officiating job with NBA in New York, NY, United States. Technology at NBA
Career patterns within men’s and women’s soccer talent systems: the typical pathway to the top is atypical
Современные футбольные академии базируются на убеждении, что ранний отбор и длительное обучение создают оптимальные условия для формирования будущих профессионалов (монофинальность). Однако ряд эмпирических работ показывает, что различные возрастные точки вступления и неоднородные карьерные пути могут приводить к сопоставимому или даже лучшему результату (равнофинальность). В этой связи авторы поставили две основные цели: во-первых, оценить связь возраста набора в академию с последующим выходом в элиту, во-вторых, с помощью «ошибок Гуттмана» количественно охарактеризовать форму карьерных траекторий и их влияние на вероятность достижения профессионального статуса. Ошибки Гуттмана — это когда человек, отвечая правильно на более сложный вопрос не может ответить на более лёгкий. В контексте исследования они показывают нелинейность развития игрока. Пример: игрока зачислили в 10 лет, в 15 лет отчислили, а в 17 снова приняли в академию. В его карьерной траектории будет 2 ошибки, в 15 и 16 лет (потому что при линейном развитии он должен был оставаться в академии или, вылетев из неё, больше не возвращаться).
Методология исследования:
1. Выборка игроков академий: 3 451 нидерландец мужского пола 1988–1999 г. р., набранный в академии с 2010 по 2021 г. (исключая иностранцев).
2. Выборка национальных команд: 493 игрока юношеских и молодёжных сборных (72 % мужчины, 28 % женщины) с 2006 по 2019 г., первые вызовы в возрасте от 14 до 22 лет.
3. Кодирование карьеры: для каждого футболиста зафиксировано членство в клубе или сборной в возрасте от 5 до 22 лет, закодированное в двоичный вектор длиной 18 элементов (0/1). Для сборников – аналогично по вызовам от 14 до 22 лет.
4. Статистический анализ:
◦ Логистическая регрессия с единственным предиктором — возраст набора в академию;
◦ Коэффициент точечно-бисериальной корреляции (pbcc) между возрастом набора и выходом в элиту;
◦ Вычисление нормализованных ошибок Гуттмана (Gn) для каждой траектории (Gn ∈ [0; 1]) и pbcc между Gn и достижением элиты
Результаты исследования:
• Процент выхода в элиту: 7,7 % академистов достигли senior elite (в статье я не нашёл расшифровки термина, но похоже, что речь про высшие дивизионы чемпионатов). 10,5 % сборников сыграли за национальную команду в возрасте до 23 лет. При этом у мужчин процент попадания в сборную не отличается от процента игроков академий на высоком уровне (7.6%). Разницу дают девушки, там 18% достигли национальной сборной, что говорит о менее широком выборе среди игроков-девушек.
• Возраст набора: средний возраст первого зачисления в академию – 11,3 года; у тех, кто достиг элиты, – 12,6 года, что статистически значимо.
• Траектории в сборных: у элитных сборников почти все (50 из 52) имели хотя бы один пропуск вызова после дебюта, а возраст первого вызова не влиял на вероятность дальнейшей карьеры на национальном уровне.
• Атипичность карьеры: несмотря на 446 уникальных траекторий, среднее значение Gn оказалось всего 0,02 (min 0, max 0,8). Корреляция между Gn и элитным статусом:
◦ среди академистов – слабоположительная;
◦ среди сборников – умеренно положительная;
Полученные данные противоречат классической идее линейного, непрерывного развития через ранний отбор. Вместо «единственного пути» (монофинальности) наблюдается равнофинальность – множество путей к высокому уровню, где временные исключения и переходы между системами зачастую способствуют формированию устойчивых навыков и психологической гибкости. Эти результаты согласуются с современными теориями многофакторного и нелинейного развития спортсменов.
@number_in_sport
#review
Современные футбольные академии базируются на убеждении, что ранний отбор и длительное обучение создают оптимальные условия для формирования будущих профессионалов (монофинальность). Однако ряд эмпирических работ показывает, что различные возрастные точки вступления и неоднородные карьерные пути могут приводить к сопоставимому или даже лучшему результату (равнофинальность). В этой связи авторы поставили две основные цели: во-первых, оценить связь возраста набора в академию с последующим выходом в элиту, во-вторых, с помощью «ошибок Гуттмана» количественно охарактеризовать форму карьерных траекторий и их влияние на вероятность достижения профессионального статуса. Ошибки Гуттмана — это когда человек, отвечая правильно на более сложный вопрос не может ответить на более лёгкий. В контексте исследования они показывают нелинейность развития игрока. Пример: игрока зачислили в 10 лет, в 15 лет отчислили, а в 17 снова приняли в академию. В его карьерной траектории будет 2 ошибки, в 15 и 16 лет (потому что при линейном развитии он должен был оставаться в академии или, вылетев из неё, больше не возвращаться).
Методология исследования:
1. Выборка игроков академий: 3 451 нидерландец мужского пола 1988–1999 г. р., набранный в академии с 2010 по 2021 г. (исключая иностранцев).
2. Выборка национальных команд: 493 игрока юношеских и молодёжных сборных (72 % мужчины, 28 % женщины) с 2006 по 2019 г., первые вызовы в возрасте от 14 до 22 лет.
3. Кодирование карьеры: для каждого футболиста зафиксировано членство в клубе или сборной в возрасте от 5 до 22 лет, закодированное в двоичный вектор длиной 18 элементов (0/1). Для сборников – аналогично по вызовам от 14 до 22 лет.
4. Статистический анализ:
◦ Логистическая регрессия с единственным предиктором — возраст набора в академию;
◦ Коэффициент точечно-бисериальной корреляции (pbcc) между возрастом набора и выходом в элиту;
◦ Вычисление нормализованных ошибок Гуттмана (Gn) для каждой траектории (Gn ∈ [0; 1]) и pbcc между Gn и достижением элиты
Результаты исследования:
• Процент выхода в элиту: 7,7 % академистов достигли senior elite (в статье я не нашёл расшифровки термина, но похоже, что речь про высшие дивизионы чемпионатов). 10,5 % сборников сыграли за национальную команду в возрасте до 23 лет. При этом у мужчин процент попадания в сборную не отличается от процента игроков академий на высоком уровне (7.6%). Разницу дают девушки, там 18% достигли национальной сборной, что говорит о менее широком выборе среди игроков-девушек.
• Возраст набора: средний возраст первого зачисления в академию – 11,3 года; у тех, кто достиг элиты, – 12,6 года, что статистически значимо.
• Траектории в сборных: у элитных сборников почти все (50 из 52) имели хотя бы один пропуск вызова после дебюта, а возраст первого вызова не влиял на вероятность дальнейшей карьеры на национальном уровне.
• Атипичность карьеры: несмотря на 446 уникальных траекторий, среднее значение Gn оказалось всего 0,02 (min 0, max 0,8). Корреляция между Gn и элитным статусом:
◦ среди академистов – слабоположительная;
◦ среди сборников – умеренно положительная;
Полученные данные противоречат классической идее линейного, непрерывного развития через ранний отбор. Вместо «единственного пути» (монофинальности) наблюдается равнофинальность – множество путей к высокому уровню, где временные исключения и переходы между системами зачастую способствуют формированию устойчивых навыков и психологической гибкости. Эти результаты согласуются с современными теориями многофакторного и нелинейного развития спортсменов.
@number_in_sport
#review
Часть 2
Авторы в статье приводят несколько рекомендаций, которые, как они считают, могут помочь в развитии юных футболистов:
• Гибкие возрастные рамки: отложить окончательное «отсевание» до 15–16 лет, чтобы снизить влияние относительного возрастного эффекта и дать шанс игрокам с «поздним» развитием.
• Поддержка после де-селекции: внедрить программы «возврата» в академии и локальные клубы, сохраняя мотивацию и игровую практику после временных перерывов.
• Многоступенчатые команды: создать параллельные группы для игроков с разными темпами развития (пример — опыт Бельгии).
Исследование демонстрирует, что «типичный» путь к футбольной элите на деле оказывается атипичным. Ранний набор в академию не гарантирует успех, а прерывающиеся, разнообразные карьерные траектории повышают шансы на достижение профессионального уровня. Эти выводы требуют пересмотра селекционных и тренерских практик в футбольных академиях и национальных командах в пользу гибких, равнофинальных моделей развития таланта.
Ссылка на исследование
@number_in_sport
#review
Авторы в статье приводят несколько рекомендаций, которые, как они считают, могут помочь в развитии юных футболистов:
• Гибкие возрастные рамки: отложить окончательное «отсевание» до 15–16 лет, чтобы снизить влияние относительного возрастного эффекта и дать шанс игрокам с «поздним» развитием.
• Поддержка после де-селекции: внедрить программы «возврата» в академии и локальные клубы, сохраняя мотивацию и игровую практику после временных перерывов.
• Многоступенчатые команды: создать параллельные группы для игроков с разными темпами развития (пример — опыт Бельгии).
Исследование демонстрирует, что «типичный» путь к футбольной элите на деле оказывается атипичным. Ранний набор в академию не гарантирует успех, а прерывающиеся, разнообразные карьерные траектории повышают шансы на достижение профессионального уровня. Эти выводы требуют пересмотра селекционных и тренерских практик в футбольных академиях и национальных командах в пользу гибких, равнофинальных моделей развития таланта.
Ссылка на исследование
@number_in_sport
#review
В последнее время в футбольных кругах стали много говорить о трекинг-данных. Хороший трекинг — это Эльдорадо, которое открывает большое пространство возможностей для глубокого анализа и построения моделей. В последнем выпуске подкаста Training Ground Guru гостями были Michael D'Oria, вице-президент Genius Sports (графика на Кубке Шотландии — это их рук дело) и Dominic Jordan, бывший директор по данным в Манчестер Юнайтед, ныне работающий в Twelve. Говорили, как понятно из названия, о прошлом, настоящем и будущем трекинг-данных в футболе, о том как должен быть организован их сбор и обработка, а также как устроены команды DS-специалистов в клубах.
D'Oria рассказал о системе, которая сейчас используется для трекинга в АПЛ (Genius их поставщик данных). Интересно, что вместо стационарных профессиональных камер они ставят 25-30 айфонов по всему периметру поля на крыше или верхних ярусах так, чтобы каждый участок поля в любой момент времени был покрыт несколькими камерами. Текущее качество и мощность айфонов позволяет получать картинку до 200 кадров в секунду в высоком разрешении, при этом система на смартфонах гораздо мобильнее и проще масштабируема.
Genuis предоставляет клиентам данные по API при чём, как я понял, есть два потока: «сырые» данные и инсайты, т. е. метрики и параметры, которые Genius предобработали и создали на своей стороне.
Я, видимо, сильно отстал от жизни, поэтому для меня откровением стала информация, что сейчас есть возможность отдавать mesh-данные (это 7-10 тысяч точек на игрока с частотой 100-200 раз в секунду) с задержкой всего в одну-две секунды. Такая скорость обработки и передачи данных позволяет DS-специалистам работать и анализировать данные прямо во время матча.
Я остался во временах sportVU и НБА (это год 2014) когда игроки изображались одной точкой, т.н. точкой центра масс, а данные процессились всю ночь и клубы получали их только на следующий день.
По мере развития трекинга игрок представляется разным числом точек:
• Игрок как одна точка (центр масс, о котором говорилось выше).
• Скелетал данные — это когда игрок представляется 25-30 ключевыми точками тела (скелетом). Например колени или локти. На таких данных уже можно пытаться делать какой-то pose estimation.
• Mesh-данные — игрок — это облако из нескольких тысяч точек, которые позволяют воссоздать его 3D в подробностях.
Mesh-данные, например, сейчас используются для построения 3D карт эпизода с возможностью его просмотра от первого лица. Такое погружение даёт лучшее понимание для игроков, потому что они видят тоже самое, что на поле, а не плоскую картинку с ТВ-камеры.
Ещё одна проблема таких систем и провайдеров — это покрытие. Данные по АПЛ доступны только командам АПЛ и, например для скаутинга, команды всё равно идут в броадкаст-трекинг. Сложно представить, что ситуация здесь кардинально изменится, особенно учитывая тот факт, что у разных лиг разные провайдеры данных. Как говорится, попробуйте договориться.
Со вторым гостем больше говорили о том, как устроена работа с данными в больших клубах и не очень, как нужно организовывать такие отделы.
Трекинг-данные можно использовать, например, для пре и пост-матч анализа, анализа стандартных положений.
Эти данные можно собирать несколькими способами, которые можно представить как трейд-офф кривую «Точность — Покрытие»
• Носимая электроника на игроках. Точно, но даёт данные только для своей команды. В основном такие датчики используются для мониторинга физических показателей игркоов.
• Стадионные системы отслеживания, как у Genius. Выше точность, но охват одна Лига, с которой есть эксклюзивное соглашение
• Трекинг по ТВ-картинке. Самая низкая точность, из-за наличия только одной камеры, которая «ходит» за мячом есть нерешаемые проблемы (покрытие всего поля, представление объёмной картины), но зато охват почти любая лига мира у которой есть трансляции.
Клубам для решения разных задач приходится балансировать и крупные игроки используют все три системы.
Подкаст
@number_in_sport
D'Oria рассказал о системе, которая сейчас используется для трекинга в АПЛ (Genius их поставщик данных). Интересно, что вместо стационарных профессиональных камер они ставят 25-30 айфонов по всему периметру поля на крыше или верхних ярусах так, чтобы каждый участок поля в любой момент времени был покрыт несколькими камерами. Текущее качество и мощность айфонов позволяет получать картинку до 200 кадров в секунду в высоком разрешении, при этом система на смартфонах гораздо мобильнее и проще масштабируема.
Genuis предоставляет клиентам данные по API при чём, как я понял, есть два потока: «сырые» данные и инсайты, т. е. метрики и параметры, которые Genius предобработали и создали на своей стороне.
Я, видимо, сильно отстал от жизни, поэтому для меня откровением стала информация, что сейчас есть возможность отдавать mesh-данные (это 7-10 тысяч точек на игрока с частотой 100-200 раз в секунду) с задержкой всего в одну-две секунды. Такая скорость обработки и передачи данных позволяет DS-специалистам работать и анализировать данные прямо во время матча.
Я остался во временах sportVU и НБА (это год 2014) когда игроки изображались одной точкой, т.н. точкой центра масс, а данные процессились всю ночь и клубы получали их только на следующий день.
По мере развития трекинга игрок представляется разным числом точек:
• Игрок как одна точка (центр масс, о котором говорилось выше).
• Скелетал данные — это когда игрок представляется 25-30 ключевыми точками тела (скелетом). Например колени или локти. На таких данных уже можно пытаться делать какой-то pose estimation.
• Mesh-данные — игрок — это облако из нескольких тысяч точек, которые позволяют воссоздать его 3D в подробностях.
Mesh-данные, например, сейчас используются для построения 3D карт эпизода с возможностью его просмотра от первого лица. Такое погружение даёт лучшее понимание для игроков, потому что они видят тоже самое, что на поле, а не плоскую картинку с ТВ-камеры.
Ещё одна проблема таких систем и провайдеров — это покрытие. Данные по АПЛ доступны только командам АПЛ и, например для скаутинга, команды всё равно идут в броадкаст-трекинг. Сложно представить, что ситуация здесь кардинально изменится, особенно учитывая тот факт, что у разных лиг разные провайдеры данных. Как говорится, попробуйте договориться.
Со вторым гостем больше говорили о том, как устроена работа с данными в больших клубах и не очень, как нужно организовывать такие отделы.
Трекинг-данные можно использовать, например, для пре и пост-матч анализа, анализа стандартных положений.
Эти данные можно собирать несколькими способами, которые можно представить как трейд-офф кривую «Точность — Покрытие»
• Носимая электроника на игроках. Точно, но даёт данные только для своей команды. В основном такие датчики используются для мониторинга физических показателей игркоов.
• Стадионные системы отслеживания, как у Genius. Выше точность, но охват одна Лига, с которой есть эксклюзивное соглашение
• Трекинг по ТВ-картинке. Самая низкая точность, из-за наличия только одной камеры, которая «ходит» за мячом есть нерешаемые проблемы (покрытие всего поля, представление объёмной картины), но зато охват почти любая лига мира у которой есть трансляции.
Клубам для решения разных задач приходится балансировать и крупные игроки используют все три системы.
Подкаст
@number_in_sport
Training Ground Guru Podcast
The past, present and future of tracking data by Training Ground Guru Podcast
Tracking data has transformed the way clubs analyse the game.This cornucopia of information is shaped and analysed by data scientists to create valuable insights for coaches, managers, Heads of Recruitment, Sporting Directors and more.But how much do you…
Часть 2
У крупных клубов с хорошей аналитической культурой (приводят в пример Ливерпуль и Сити), сейчас выстроена цепочка DS → Аналитик→ Тренер. Задача первого «перевести» данные с языка цифр в плоскость полезной информации и инсайтов. Для этого нужно правильно работать с данными: валидировать их качество, верно выбрать архитектуру хранилища и используемые тулзы, чтобы они не стали узким местом по скорости. Здесь нужны специфические знания специалистов в конкретных областях. В малых клубах до сих пор обходятся «швейцарскими» ножами, которые и данные анализируют, и дашборды строят и ещё и тренируют. Понятно, что такой человек вряд ли сможет разработать сложные ML-модели.
В конце проговорили, как мне кажется, очень важную вещь: данные и специалисты по ним не должны забирать работу аналитиков и тренерского штаба. Данные позволяют автоматизировать рутинную работу по сбору и созданию метрик для того, чтобы уже аналитики или тренера, просмотрев их, учитывали эту информацию в своих решениях. Нечто похожее может делать и человек, например аналитик, но он может обработать ограниченный объём данных. Если не нужно будет вручную теггировать игры это не значит, что можно увольнять всех аналитиков, это значит, что они займутся своими прямыми обязанностями, а не ручным трудом, который в других сферах на Толоке выполняют пенсионеры и мамы в декрете.
В целом получился интересный разговор, кому позволяет знание английского советую послушать.
@number_in_sport
У крупных клубов с хорошей аналитической культурой (приводят в пример Ливерпуль и Сити), сейчас выстроена цепочка DS → Аналитик→ Тренер. Задача первого «перевести» данные с языка цифр в плоскость полезной информации и инсайтов. Для этого нужно правильно работать с данными: валидировать их качество, верно выбрать архитектуру хранилища и используемые тулзы, чтобы они не стали узким местом по скорости. Здесь нужны специфические знания специалистов в конкретных областях. В малых клубах до сих пор обходятся «швейцарскими» ножами, которые и данные анализируют, и дашборды строят и ещё и тренируют. Понятно, что такой человек вряд ли сможет разработать сложные ML-модели.
В конце проговорили, как мне кажется, очень важную вещь: данные и специалисты по ним не должны забирать работу аналитиков и тренерского штаба. Данные позволяют автоматизировать рутинную работу по сбору и созданию метрик для того, чтобы уже аналитики или тренера, просмотрев их, учитывали эту информацию в своих решениях. Нечто похожее может делать и человек, например аналитик, но он может обработать ограниченный объём данных. Если не нужно будет вручную теггировать игры это не значит, что можно увольнять всех аналитиков, это значит, что они займутся своими прямыми обязанностями, а не ручным трудом, который в других сферах на Толоке выполняют пенсионеры и мамы в декрете.
В целом получился интересный разговор, кому позволяет знание английского советую послушать.
@number_in_sport
Ещё один график в копилку великолепия вчерашней игры Дембеле. С матче с Интером он сделал 22 спринта, на которых пробежал почти полкилометра. Это на 5 больше, чем у Хвичи и Хакими и на 10 больше чем у Барелы, игрока Интера с наибольшим числом спринтов. Колоссальная игра от Дембеле.
@numbers_in_sport
@numbers_in_sport
Стало интересно посмотреть, как у футболистов в чемпионатах Big 5 меняются зоны передач от сезона к сезону. Для этого взял идею The Athletic по определению таких зон как одно стандартное отклонение от средних координат игрока и две метрики, которые используются в компьютерном зрении для оценки правильности детекции объектов: IoU и Similarity.
IoU (Intersection over Union) — метрика перекрытия зон передач в двух сезонах. Показывает, какой процент от общей площади многоугольников в двух сезонах общий.
Similarity — схожесть зон передач в двух сезонах. Показывает какой процент зоны текущего сезона попадает в зону сезона прошлого.
Метрики похожи и кажется, что дублируют друг друга, но это не совсем так. Приведу пример, когда значения IoU и Similarity могут отличаться. Допустим у нас есть фланговый игрок, который играет только вдоль бровки. Его зона передач будет очень узкой и «прилеплена» к боковой линии. Но в новом сезоне паттерн задействования игрока изменился: он также остаётся фланговым игроком, но теперь гораздо чаще смещается в центральную зону, например становится опорником при билд-апе. Из-за этого его зона передач сильно растянется к другой бровке и получится, что зона прошлого сезона полностью лежит в многоугольнике сезона этого (similarity 1), а вот IoU, из-за роста площади зоны в текущем, может быть маленьким, например меньше 0.5.
Классический паттерн низких значений этих метрик: центральный защитник, который поменял сторону. Центрдефы дают много передач, поэтому их зоны получаются довольно компактными и смена позиции даже в двойке ЦЗ приводит к очень низким показателям IoU и Similarity. Так в этом году получилось у Тапсобы (IoU 0.19, Similarity 0.3) и Рюдигера (0.22, 0.39).
Но интересней рассмотреть игроков, позиции которых как бы не предполагают больших изменений показателей между сезонами. Рассмотрим двух игроков: Уэса Маккенни и Романо Шмида.
Уэс при Аллегри был строго игроком правого фланга о чём и говорит зона его передач (чёрный многоугольник). В прошедшем сезоне Уэс стал использоваться иначе. Маккенни в нынешнем году — это игрок с бимодальным распределением по ширине поля. Это значит, что помимо пика ближе к правой бровке у него появился такой же пик и на противоположном краю. При этом само распределение стало более равномерным, Уэс стал делать больше передач не только из фланговых позиций, но и из центра поля. Честнее его многоугольник было бы разбить на два с центрами у разных флангов, но даже такая «неправильная» интерпретация хороша показывает изменение в игре Уэса — он был везде. Это неплохо ложится на eye-тест тех немногих игр Ювентуса, которые я посмотрел в этом году.
У Романо Шмида в обоих сезонах нормальные распределения по координатам, но в сезоне 24/25 он поменял фланг, к которому тяготеет его игра с правого на левый. Это изменение или нет помогло провести Шмиду отличный сезон (пост с цифрами в канале Аргонавтика), но теперь он явный кандидат на переход в более статусную команду, чем Бремен.
Дизайн графика пока «in progress», поэтому прошу строго не судить.
@numbers_in_sport
IoU (Intersection over Union) — метрика перекрытия зон передач в двух сезонах. Показывает, какой процент от общей площади многоугольников в двух сезонах общий.
Similarity — схожесть зон передач в двух сезонах. Показывает какой процент зоны текущего сезона попадает в зону сезона прошлого.
Метрики похожи и кажется, что дублируют друг друга, но это не совсем так. Приведу пример, когда значения IoU и Similarity могут отличаться. Допустим у нас есть фланговый игрок, который играет только вдоль бровки. Его зона передач будет очень узкой и «прилеплена» к боковой линии. Но в новом сезоне паттерн задействования игрока изменился: он также остаётся фланговым игроком, но теперь гораздо чаще смещается в центральную зону, например становится опорником при билд-апе. Из-за этого его зона передач сильно растянется к другой бровке и получится, что зона прошлого сезона полностью лежит в многоугольнике сезона этого (similarity 1), а вот IoU, из-за роста площади зоны в текущем, может быть маленьким, например меньше 0.5.
Классический паттерн низких значений этих метрик: центральный защитник, который поменял сторону. Центрдефы дают много передач, поэтому их зоны получаются довольно компактными и смена позиции даже в двойке ЦЗ приводит к очень низким показателям IoU и Similarity. Так в этом году получилось у Тапсобы (IoU 0.19, Similarity 0.3) и Рюдигера (0.22, 0.39).
Но интересней рассмотреть игроков, позиции которых как бы не предполагают больших изменений показателей между сезонами. Рассмотрим двух игроков: Уэса Маккенни и Романо Шмида.
Уэс при Аллегри был строго игроком правого фланга о чём и говорит зона его передач (чёрный многоугольник). В прошедшем сезоне Уэс стал использоваться иначе. Маккенни в нынешнем году — это игрок с бимодальным распределением по ширине поля. Это значит, что помимо пика ближе к правой бровке у него появился такой же пик и на противоположном краю. При этом само распределение стало более равномерным, Уэс стал делать больше передач не только из фланговых позиций, но и из центра поля. Честнее его многоугольник было бы разбить на два с центрами у разных флангов, но даже такая «неправильная» интерпретация хороша показывает изменение в игре Уэса — он был везде. Это неплохо ложится на eye-тест тех немногих игр Ювентуса, которые я посмотрел в этом году.
У Романо Шмида в обоих сезонах нормальные распределения по координатам, но в сезоне 24/25 он поменял фланг, к которому тяготеет его игра с правого на левый. Это изменение или нет помогло провести Шмиду отличный сезон (пост с цифрами в канале Аргонавтика), но теперь он явный кандидат на переход в более статусную команду, чем Бремен.
Дизайн графика пока «in progress», поэтому прошу строго не судить.
@numbers_in_sport
Вариант как провести оставшиеся часы перед выходными.
В марте на глаза попалась рекламная брошюра одной компании на М, которая рассказывала об использовании их модели Llama в футбольном клубе Севилья.
Кратко: для обогащения цифровых метрик игрока отчётами скаутов.
Более полно я написал в блоге канала на sports.ru. Постарался простым и понятным языком изложить, зачем такая система нужна, из каких компонентов она состоит и как в целом это работает.
Надеюсь получилось интересно!
Ссылка на пост
@numbers_in_sport
В марте на глаза попалась рекламная брошюра одной компании на М, которая рассказывала об использовании их модели Llama в футбольном клубе Севилья.
Кратко: для обогащения цифровых метрик игрока отчётами скаутов.
Более полно я написал в блоге канала на sports.ru. Постарался простым и понятным языком изложить, зачем такая система нужна, из каких компонентов она состоит и как в целом это работает.
Надеюсь получилось интересно!
Ссылка на пост
@numbers_in_sport
Sports.ru
«Севилья» с помощью Llama обрабатывает тысячи скаутских отчетов за секунды. Как технологии AI помогают в поиске талантов
В ходе работы приложения ни одно животное не пострадало.