logo móvil
Contáctanos

Un marco específico para jugadores para la generación de aspectos destacados de cricket utilizando redes neuronales convolucionales profundas

Autores: Mahum, Rabbia; Irtaza, Aun; Rehman, Saeed Ur; Meraj, Talha; Rauf, Hafiz Tayyab

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Un marco específico para jugadores para la generación de aspectos destacados de cricket utilizando redes neuronales convolucionales profundas


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Resumen de video
Dominio de cricket
Resúmenes de jugadores
Jugador específico
Reconocimiento óptico de caracteres
Clasificador AlexNet

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
Las formas automáticas de generar resúmenes de video son una técnica clave para gestionar el enorme contenido de video en la actualidad. El objetivo de los resúmenes de video es proporcionar información importante en menos tiempo a los espectadores. Existen algunas técnicas para resumir videos en el ámbito del cricket, sin embargo, hasta donde sabemos, nuestro modelo propuesto es el primero en tratar con éxito resúmenes específicos de jugadores en videos de cricket. En este estudio, proporcionamos un marco novedoso y una técnica valiosa para la summarización y clasificación de videos de cricket. Para el resumen de video específico del jugador, la técnica propuesta explota el hecho de la presencia de la Leyenda de Puntuación (LP) en los fotogramas. En la primera etapa, se aplica el reconocimiento óptico de caracteres (OCR) para extraer un resumen de texto de LP y encontrar todos los fotogramas del jugador específico, como el Fotograma de Inicio (FI) hasta el Último Fotograma (UF). En la segunda etapa, varios fotogramas de videos de cricket se utilizan en el clasificador supervisado AlexNet para el entrenamiento junto con etiquetas de clase como positivo y negativo para la clasificación binaria. Se entrena una red pre-entrenada para la clasificación binaria de esos fotogramas obtenidos de la primera fase, mostrando el rendimiento de un jugador específico junto con algunas escenas adicionales. En la tercera fase, se emplea una técnica de identificación de personas para reconocer los fotogramas que contienen al jugador específico. Luego, los fotogramas se recortan y se extraen características SIFT de la persona identificada para clusterizar aún más estos fotogramas utilizando el método de clusterización fuzzy c-means. La razón detrás de la tercera fase es optimizar aún más los resúmenes de video, ya que los fotogramas obtenidos en la segunda etapa incluían también el fotograma del jugador compañero. El marco propuesto utiliza con éxito el conjunto de datos de videos de cricket. Además, la técnica es muy eficiente y útil para la difusión de los mejores momentos de videos de cricket de un jugador específico. Los resultados experimentales indican que nuestro método propuesto supera los resultados previamente mencionados, mejorando la precisión general hasta un 95%.

Otros recursos que podrían interesarte

Temas Virtualpro