diciembre 9, 2022

Diario El Progreso.com

Spanish News Today para obtener las últimas noticias, estilo de vida y información turística en España alrededor de España.

Los ladrillos de datos alimentan el análisis de la liga de fútbol más importante de España

Cuente a la principal liga de fútbol de España entre las organizaciones que están totalmente comprometidas con la analítica.

LaLiga, sede de clubes de renombre como el Real Madrid y el Barcelona, ​​y de jugadores como el actual máximo goleador Karim Benzema y la estrella Luis Suárez, adoptó la plataforma Databricks Lakehouse en 2018. La liga ahora la usa para informar a sus 20 clubes sobre el Juega en la cancha, así como a sus fanáticos mientras siguen los partidos en sus televisores y dispositivos móviles.

Databricks, fundada en 2013 y con sede en San Francisco, es un proveedor de lagos de datos cuya plataforma basada en la nube combina los beneficios de los almacenes de datos y los lagos de datos. Dentro de sus lagos, los usuarios pueden consultar y analizar datos estructurados utilizando SQL como con un almacén de datos y datos no estructurados dentro de la arquitectura flexible de un lago de datos.

LaLiga, por su parte, lleva en funcionamiento desde 1929 y es la máxima liga de fútbol de España. El Real Madrid ha sido su club más dominante, reclamando 34 campeonatos, mientras que estrellas recientes incluyen a Cristiano Ronaldo y Lionel Messi.

Un cambio hacia la analítica

Hace poco menos de una década, la liga sentía que estaba atrasada en cuanto a análisis, según Tom Woods, líder de marketing y comunicaciones de LaLiga Tech.

Muchas de las empresas más grandes del mundo han estado utilizando análisis para informar decisiones comerciales durante años. Y las organizaciones deportivas, incluidas las Grandes Ligas de Béisbol en los Estados Unidos y los órganos rectores del tenis en todo el mundo, la Asociación de Profesionales del Tenis y la Asociación de Tenis Femenino, han utilizado análisis durante un par de décadas para maximizar el rendimiento de los jugadores e informar a sus fanáticos.

Por ejemplo, como se documenta en el libro, y en la película posterior, bola de dinerolos Oakland Athletics de béisbol fueron los primeros pioneros de la analítica en los deportes, utilizando datos a comienzos del siglo XXI para encontrar valor en los jugadores ignorados por otros equipos y competir por campeonatos a pesar de tener una de las nóminas más pequeñas.

Sin embargo, en la segunda década del siglo XXI, la principal liga de fútbol de España aún no había comenzado a utilizar análisis.

Finalmente, cuando Javier Tebas asumió la presidencia de la liga en 2013 y hizo del análisis una prioridadeso cambió, según Rafael Zambrano López, responsable de ciencia de datos de LaLiga.

«Nuestro presidente decidió… hacernos más basados ​​en datos, y nuestro departamento se inició [at that time]», dijo. «Empezamos a construir todo desde cero, y hemos ido desde allí hasta ahora».

El ímpetu para que el movimiento se volviera más basado en datos provino de un sentido de responsabilidad hacia los clubes de la liga, agregó Woods. Señaló que, si bien muchas organizaciones deportivas habían comenzado a reconocer el valor de la analítica, el fútbol europeo en su conjunto aún no se había basado en datos.

Ahora, sin embargo, entre otras importantes ligas de fútbol europeas, la Bundesliga alemana utiliza AWS para el análisis y la La Premier League inglesa utiliza Oracle Cloud.

«Somos responsables de guiar a nuestros clubes y vimos una responsabilidad como liga para ayudar a estos clubes a adaptarse a nuevas formas de hacer las cosas», dijo Woods. «Lo vimos como necesario para mantener las cosas funcionando de manera eficiente y atraer a los fanáticos».

Eso significó desarrollar un ecosistema de toma de decisiones que pudiera ayudar al producto en el campo, la experiencia de los fanáticos e incluso ayudar a los clubes con cosas como la detección de fraudes y la prevención del amaño de partidos, continuó.

En un principio, LaLiga desarrolló sus propios sistemas de gestión y análisis de datos. Sin embargo, finalmente, la liga decidió adoptar una plataforma de datos y análisis y combinar las capacidades existentes de la liga de fútbol con las de un proveedor.

Según Zambrano López, LaLiga conoció Databricks a través de su relación con Microsoft y eligió Databricks por su velocidad, facilidad de uso y bajo costo.

LaLiga de España está utilizando Databricks para ayudar a capturar datos y brindar información a sus equipos y aficionados.

Hacer más con los datos

Ahora, tras adoptar Databricks unos años después de apostar por la analítica, la liga española de fútbol captura más de 3 millones de filas de datos por partido. Pone esos datos en acción al entregar informes a los equipos y brindar estadísticas a los aficionados en cuestión de segundos mientras se desarrollan los partidos en la cancha de fútbol.

Las cámaras recogen la posición de los jugadores y el balón, y combinamos esos datos con los datos del evento: pases, goles, tarjetas rojas, tarjetas amarillas, etc. – y eso nos permite crear nuestras métricas. Hay alrededor de 25 métricas y podemos compartirlas con todos los clubes para que puedan mejorar.

rafael zambrano lopezResponsable de ciencia de datos, LaLiga

LaLiga posiciona cámaras estratégicamente en cada uno de sus estadios, y es a través de esas cámaras que la liga captura todos esos datos de cada partido. Las cámaras rastrean cada movimiento de cada jugador, toman 25 cuadros por segundo y envían esos datos a Databricks, donde se alimentan automáticamente a modelos de datos desarrollados por Zambrano López y su equipo para análisis en tiempo real.

“Las cámaras recogen la posición de los jugadores y el balón, y combinamos esos datos con los datos del evento -los pases, goles, tarjetas rojas, tarjetas amarillas, etc.- y eso nos permite crear nuestras métricas”, dijo Zambrano López. . «Hay alrededor de 25 métricas y podemos compartirlas con todos los clubes para que puedan mejorar».

Una de esas métricas es la probabilidad de gol.

Cuando un jugador realiza un tiro, ya sea que realmente resulte en un gol o no, en aproximadamente 30 segundos, la combinación de Databricks y modelos de datos desarrollados por LaLiga puede determinar la probabilidad de que el tiro resulte en un gol y compartir esa información con los equipos. locutores y aficionados mientras se desarrolla el partido.

Los equipos pueden usar inmediatamente dicha información para determinar si los jugadores están ayudando al equipo con un juego inteligente o perjudicándolo, por ejemplo, al realizar tiros que tienen pocas posibilidades de entrar cuando un pase podría haber resultado en una mejor oportunidad de anotar. Mientras tanto, los fanáticos están mejor informados durante el transcurso de un partido.

Pero las capacidades de análisis de Databricks están permitiendo a los equipos de la liga saber mucho más que solo la probabilidad de gol durante un partido de fútbol.

Mediante el seguimiento del movimiento de los jugadores (cuánto corren durante un partido, cómo cambia su velocidad y cómo su forma de andar puede diferir de un partido a otro debido a la fatiga), los clubes pueden intentar predecir y prevenir las lesiones de los jugadores antes de que ocurran.

En total, utilizando Databricks, LaLiga proporciona a cada equipo un informe de 150 páginas después de cada partido.

«Se les entrega una gran cantidad de datos que luego pueden analizar internamente», dijo Woods. «Les brindamos ayuda sobre cómo analizar bien la información, pero muchos clubes ahora están invirtiendo en sus propios equipos de análisis. Y muchos de ellos ahora atribuyen victorias o temporadas particularmente buenas a una mejor comprensión de la competencia».

Agregó que si bien todos los clubes han sido receptivos a los análisis, unos cinco han invertido más agresivamente. Sevilla, actualmente empatado en el segundo lugar de la clasificación detrás del Real Madrid, es un ejemplo.

Más por venir

En septiembre de 2021, la liga lanzó LaLiga Tech para proporcionar a otras organizaciones deportivas, no solo en el fútbol, ​​las capacidades analíticas que LaLiga desarrolló en conjunto con Databricks y sus otros socios tecnológicos, incluido Microsoft.

«Estamos comenzando a implementar un negocio completamente nuevo desde dentro de LaLiga, donde todo lo que hemos creado hasta ahora está siendo adoptado por terceros en todo el mundo». [sports] industria «, dijo Woods. «Ahora vemos un poco más de conciencia acerca de ir a un modelo digital, pero es poco a poco. Estamos en posición de brindar estos servicios al resto de la industria, y Databricks es una parte central de eso».

Mientras tanto, el equipo de datos centralizados de la liga se reúne con los clubes aproximadamente una vez cada dos semanas para obtener comentarios sobre los datos que les proporciona a los clubes, y está trabajando para agregar nuevas herramientas para analizar el juego. Según Zambrano López, LaLiga está experimentando con herramientas de Databricks como MLflow y Delta Lake.

«Siempre estamos explorando cosas nuevas que hacer con Databricks», dijo.

READ  Goles y resumen: España 2-1 Holanda en la semifinal de la Copa Mundial Femenina Sub-20 2022. | 25/08/2022