logo móvil
Contáctanos

Innovaciones en aprendizaje profundo en clasificación de video: un estudio sobre técnicas y evaluaciones de conjuntos de datos

Autores: Mao, Makara; Lee, Ahyoung; Hong, Min

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Innovaciones en aprendizaje profundo en clasificación de video: un estudio sobre técnicas y evaluaciones de conjuntos de datos


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Clasificación de videos
Modelos de aprendizaje profundo
Conjuntos de datos
Arquitecturas de red
Métricas de evaluación de modelos
Técnicas de aumento de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
La clasificación de videos ha logrado un éxito notable en los últimos años, impulsada por modelos avanzados de aprendizaje profundo que categorizan automáticamente el contenido de video. Este documento proporciona una revisión exhaustiva de las técnicas de clasificación de videos y los conjuntos de datos utilizados en este campo. Resumimos hallazgos clave de investigaciones recientes, centrándonos en arquitecturas de redes, métricas de evaluación de modelos y métodos de procesamiento paralelo que mejoran la velocidad de entrenamiento. Nuestra revisión incluye un análisis detallado de modelos de aprendizaje profundo de última generación y arquitecturas híbridas, comparando modelos con enfoques tradicionales y destacando sus ventajas y limitaciones. Se exploran desafíos críticos como el manejo de conjuntos de datos a gran escala, mejorar la robustez del modelo y abordar limitaciones computacionales. Al evaluar métricas de rendimiento, identificamos áreas donde los modelos actuales se destacan y dónde se necesitan mejoras. Además, discutimos técnicas de aumento de datos diseñadas para mejorar la precisión del conjunto de datos y abordar desafíos específicos en tareas de clasificación de videos. Esta encuesta también examina la evolución de las redes neuronales convolucionales (CNN) en el procesamiento de imágenes y su adaptación a tareas de clasificación de videos. Proponemos direcciones futuras de investigación y proporcionamos una comparación detallada de enfoques existentes utilizando el conjunto de datos UCF-101, destacando el progreso y los desafíos continuos en la consecución de una clasificación de video robusta.

Otros recursos que podrían interesarte

Temas Virtualpro