Aprendizaje Automático en Análisis de Béisbol: Sabermetría y Más Allá
Autores: Zhao, Wenbing; Akella, Vyaghri Seetharamayya; Yang, Shunkun; Luo, Xiong
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Aprendizaje Automático en Análisis de Béisbol: Sabermetría y Más Allá
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje automático
Análisis deportivo
Béisbol
Repositorios de datos
Preguntas de investigación
Técnicas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este artículo, proporcionamos una revisión completa de la analítica deportiva basada en aprendizaje automático en el béisbol. Esta revisión está guiada principalmente por las siguientes tres preguntas de investigación: (1) ¿Qué problemas de analítica en béisbol se han estudiado utilizando aprendizaje automático? (2) ¿Qué repositorios de datos se han utilizado? (3) ¿Qué técnicas de aprendizaje automático se han empleado para estos estudios y cómo? Los hallazgos de estas preguntas de investigación conducen a varias contribuciones de investigación. Primero, proporcionamos una taxonomía para los problemas de analítica en béisbol. Según la taxonomía propuesta, se ha empleado aprendizaje automático para (1) predecir jugadas individuales en el juego; (2) determinar el rendimiento de los jugadores; (3) estimar la valoración de los jugadores; (4) predecir futuras lesiones de los jugadores; y (5) proyectar los resultados futuros de los juegos. En segundo lugar, identificamos un conjunto de repositorios de datos para estudios de analítica en béisbol. Los repositorios de datos más populares son Baseball Savant y Baseball Reference. En tercer lugar, realizamos un análisis en profundidad de los modelos de aprendizaje automático aplicados en la analítica de béisbol. Los modelos de aprendizaje automático más populares son el bosque aleatorio y la máquina de soporte vectorial. Además, solo una pequeña fracción de los estudios ha seguido rigurosamente las mejores prácticas en la preprocesamiento de datos, entrenamiento de modelos de aprendizaje automático, pruebas e interpretación de resultados de predicción.
Descripción
En este artículo, proporcionamos una revisión completa de la analítica deportiva basada en aprendizaje automático en el béisbol. Esta revisión está guiada principalmente por las siguientes tres preguntas de investigación: (1) ¿Qué problemas de analítica en béisbol se han estudiado utilizando aprendizaje automático? (2) ¿Qué repositorios de datos se han utilizado? (3) ¿Qué técnicas de aprendizaje automático se han empleado para estos estudios y cómo? Los hallazgos de estas preguntas de investigación conducen a varias contribuciones de investigación. Primero, proporcionamos una taxonomía para los problemas de analítica en béisbol. Según la taxonomía propuesta, se ha empleado aprendizaje automático para (1) predecir jugadas individuales en el juego; (2) determinar el rendimiento de los jugadores; (3) estimar la valoración de los jugadores; (4) predecir futuras lesiones de los jugadores; y (5) proyectar los resultados futuros de los juegos. En segundo lugar, identificamos un conjunto de repositorios de datos para estudios de analítica en béisbol. Los repositorios de datos más populares son Baseball Savant y Baseball Reference. En tercer lugar, realizamos un análisis en profundidad de los modelos de aprendizaje automático aplicados en la analítica de béisbol. Los modelos de aprendizaje automático más populares son el bosque aleatorio y la máquina de soporte vectorial. Además, solo una pequeña fracción de los estudios ha seguido rigurosamente las mejores prácticas en la preprocesamiento de datos, entrenamiento de modelos de aprendizaje automático, pruebas e interpretación de resultados de predicción.