Red neuronal causal de secuencia basada en aprendizaje profundo a largo plazo y red convolucional recurrente para fusión de datos utilizando datos de video
Autores: Jeon, DaeHyeon; Kim, Min-Suk
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Red neuronal causal de secuencia basada en aprendizaje profundo a largo plazo y red convolucional recurrente para fusión de datos utilizando datos de video
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Esquemas basados en IA
Sistemas inteligentes
Arquitecturas de redes basadas en aprendizaje profundo
Fusión de datos de secuencia
Arquitectura de redes neuronales
Red neuronal convolucional recurrente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El propósito de los esquemas basados en IA en sistemas inteligentes es avanzar y optimizar el rendimiento del sistema. La mayoría de los sistemas inteligentes adoptan tipos de datos secuenciales derivados de dichos sistemas. Los datos de video en tiempo real, por ejemplo, se actualizan continuamente como una secuencia para realizar predicciones necesarias para un rendimiento eficiente del sistema. La mayoría de las arquitecturas de redes basadas en aprendizaje profundo como la memoria a largo plazo (LSTM), la fusión de datos, los dos flujos y la red convolucional temporal (TCN) para la fusión de datos de secuencia se utilizan generalmente para mejorar la eficiencia robusta del sistema. En este documento, proponemos una arquitectura de red neuronal basada en aprendizaje profundo para datos no fijos que utiliza tanto una red neuronal convolucional causal (CNN) como una red convolucional recurrente a largo plazo (LRCN). Las CNN causales y las LRCN utilizan capas convolucionales incorporadas para la extracción de características, por lo que ambas arquitecturas son capaces de procesar datos secuenciales como series temporales o datos de video que se pueden utilizar en una variedad de aplicaciones. Ambas arquitecturas también han extraído características de los datos de secuencia de entrada para reducir la dimensionalidad de los datos y capturar la información importante, y aprender representaciones jerárquicas para tareas efectivas de procesamiento de secuencias. También hemos adoptado un concepto de red neuronal recurrente convolucional compacta en serie (SCCRNN), que es un tipo de arquitectura de red neuronal diseñada para procesar datos secuenciales combinados por capas convolucionales y recurrentes de manera compacta, reduciendo el número de parámetros y el uso de memoria para mantener una alta precisión. La arquitectura es desafiante y adecuada para datos de video de secuencia entrantes continuamente, y al hacerlo nos permitió aportar ventajas tanto a las redes basadas en LSTM como a las redes basadas en CNN. Para verificar este método, lo evaluamos a través de un modelo de aprendizaje de secuencias con parámetros de red y memoria que se requieren en entornos reales basados en el conjunto de datos UCF-101, que es un conjunto de datos de reconocimiento de acciones de videos de acción realistas, recopilados de YouTube con 101 categorías de acciones. Los resultados muestran que el modelo propuesto en una red convolucional recurrente a largo plazo causal en secuencia (SCLRCN) proporciona una mejora de rendimiento de al menos aproximadamente un 12% o más en comparación con los modelos existentes (LRCN y TCN).
Descripción
El propósito de los esquemas basados en IA en sistemas inteligentes es avanzar y optimizar el rendimiento del sistema. La mayoría de los sistemas inteligentes adoptan tipos de datos secuenciales derivados de dichos sistemas. Los datos de video en tiempo real, por ejemplo, se actualizan continuamente como una secuencia para realizar predicciones necesarias para un rendimiento eficiente del sistema. La mayoría de las arquitecturas de redes basadas en aprendizaje profundo como la memoria a largo plazo (LSTM), la fusión de datos, los dos flujos y la red convolucional temporal (TCN) para la fusión de datos de secuencia se utilizan generalmente para mejorar la eficiencia robusta del sistema. En este documento, proponemos una arquitectura de red neuronal basada en aprendizaje profundo para datos no fijos que utiliza tanto una red neuronal convolucional causal (CNN) como una red convolucional recurrente a largo plazo (LRCN). Las CNN causales y las LRCN utilizan capas convolucionales incorporadas para la extracción de características, por lo que ambas arquitecturas son capaces de procesar datos secuenciales como series temporales o datos de video que se pueden utilizar en una variedad de aplicaciones. Ambas arquitecturas también han extraído características de los datos de secuencia de entrada para reducir la dimensionalidad de los datos y capturar la información importante, y aprender representaciones jerárquicas para tareas efectivas de procesamiento de secuencias. También hemos adoptado un concepto de red neuronal recurrente convolucional compacta en serie (SCCRNN), que es un tipo de arquitectura de red neuronal diseñada para procesar datos secuenciales combinados por capas convolucionales y recurrentes de manera compacta, reduciendo el número de parámetros y el uso de memoria para mantener una alta precisión. La arquitectura es desafiante y adecuada para datos de video de secuencia entrantes continuamente, y al hacerlo nos permitió aportar ventajas tanto a las redes basadas en LSTM como a las redes basadas en CNN. Para verificar este método, lo evaluamos a través de un modelo de aprendizaje de secuencias con parámetros de red y memoria que se requieren en entornos reales basados en el conjunto de datos UCF-101, que es un conjunto de datos de reconocimiento de acciones de videos de acción realistas, recopilados de YouTube con 101 categorías de acciones. Los resultados muestran que el modelo propuesto en una red convolucional recurrente a largo plazo causal en secuencia (SCLRCN) proporciona una mejora de rendimiento de al menos aproximadamente un 12% o más en comparación con los modelos existentes (LRCN y TCN).