Innovaciones en aprendizaje profundo en clasificación de video: un estudio sobre técnicas y evaluaciones de conjuntos de datos
Autores: Mao, Makara; Lee, Ahyoung; Hong, Min
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Innovaciones en aprendizaje profundo en clasificación de video: un estudio sobre técnicas y evaluaciones de conjuntos de datos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación de videos
Modelos de aprendizaje profundo
Conjuntos de datos
Arquitecturas de red
Métricas de evaluación de modelos
Técnicas de aumento de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
La clasificación de videos ha logrado un éxito notable en los últimos años, impulsada por modelos avanzados de aprendizaje profundo que categorizan automáticamente el contenido de video. Este documento proporciona una revisión exhaustiva de las técnicas de clasificación de videos y los conjuntos de datos utilizados en este campo. Resumimos hallazgos clave de investigaciones recientes, centrándonos en arquitecturas de redes, métricas de evaluación de modelos y métodos de procesamiento paralelo que mejoran la velocidad de entrenamiento. Nuestra revisión incluye un análisis detallado de modelos de aprendizaje profundo de última generación y arquitecturas híbridas, comparando modelos con enfoques tradicionales y destacando sus ventajas y limitaciones. Se exploran desafíos críticos como el manejo de conjuntos de datos a gran escala, mejorar la robustez del modelo y abordar limitaciones computacionales. Al evaluar métricas de rendimiento, identificamos áreas donde los modelos actuales se destacan y dónde se necesitan mejoras. Además, discutimos técnicas de aumento de datos diseñadas para mejorar la precisión del conjunto de datos y abordar desafíos específicos en tareas de clasificación de videos. Esta encuesta también examina la evolución de las redes neuronales convolucionales (CNN) en el procesamiento de imágenes y su adaptación a tareas de clasificación de videos. Proponemos direcciones futuras de investigación y proporcionamos una comparación detallada de enfoques existentes utilizando el conjunto de datos UCF-101, destacando el progreso y los desafíos continuos en la consecución de una clasificación de video robusta.
Descripción
La clasificación de videos ha logrado un éxito notable en los últimos años, impulsada por modelos avanzados de aprendizaje profundo que categorizan automáticamente el contenido de video. Este documento proporciona una revisión exhaustiva de las técnicas de clasificación de videos y los conjuntos de datos utilizados en este campo. Resumimos hallazgos clave de investigaciones recientes, centrándonos en arquitecturas de redes, métricas de evaluación de modelos y métodos de procesamiento paralelo que mejoran la velocidad de entrenamiento. Nuestra revisión incluye un análisis detallado de modelos de aprendizaje profundo de última generación y arquitecturas híbridas, comparando modelos con enfoques tradicionales y destacando sus ventajas y limitaciones. Se exploran desafíos críticos como el manejo de conjuntos de datos a gran escala, mejorar la robustez del modelo y abordar limitaciones computacionales. Al evaluar métricas de rendimiento, identificamos áreas donde los modelos actuales se destacan y dónde se necesitan mejoras. Además, discutimos técnicas de aumento de datos diseñadas para mejorar la precisión del conjunto de datos y abordar desafíos específicos en tareas de clasificación de videos. Esta encuesta también examina la evolución de las redes neuronales convolucionales (CNN) en el procesamiento de imágenes y su adaptación a tareas de clasificación de videos. Proponemos direcciones futuras de investigación y proporcionamos una comparación detallada de enfoques existentes utilizando el conjunto de datos UCF-101, destacando el progreso y los desafíos continuos en la consecución de una clasificación de video robusta.