Red de Predicción Piramidal: un modelo para la predicción de marcos visuales basado en la teoría del código predictivo
Autores: Ling, Chaofan; Zhong, Junpei; Li, Weihua
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Red de Predicción Piramidal: un modelo para la predicción de marcos visuales basado en la teoría del código predictivo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Predicción de marco visual
Modelo de red neuronal
Teoría de codificación predictiva
La corteza cerebral oscila
Unidades recurrentes y convolucionales
Precisión de la predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 52
Citaciones: Sin citaciones
La predicción de cuadros visuales es una tarea de predicción densa de píxeles que infiere cuadros futuros a partir de cuadros pasados. Una falta de detalles de apariencia, baja precisión de predicción y una alta sobrecarga computacional siguen siendo problemas importantes asociados con los modelos o métodos actuales. En este documento, proponemos un nuevo modelo de red neuronal inspirado en la conocida teoría de codificación predictiva para hacer frente a estos problemas. La codificación predictiva proporciona un marco computacional interesante y confiable. Combinamos este enfoque con otras teorías, como la teoría de que la corteza cerebral oscila a diferentes frecuencias en diferentes niveles, para diseñar un modelo de red predictiva eficiente y confiable para la predicción de cuadros visuales. Específicamente, el modelo está compuesto por una serie de unidades recurrentes y convolucionales que forman las corrientes de arriba hacia abajo y de abajo hacia arriba, respectivamente. La frecuencia de actualización de las unidades neuronales en cada una de las capas disminuye con el aumento en el nivel de la red, lo que significa que las neuronas de un nivel más alto pueden capturar información en dimensiones temporales más largas. Según los resultados experimentales, este modelo mostró una mejor compacidad y un rendimiento predictivo comparable con los de trabajos existentes, lo que implica un menor costo computacional y una mayor precisión de predicción.
Descripción
La predicción de cuadros visuales es una tarea de predicción densa de píxeles que infiere cuadros futuros a partir de cuadros pasados. Una falta de detalles de apariencia, baja precisión de predicción y una alta sobrecarga computacional siguen siendo problemas importantes asociados con los modelos o métodos actuales. En este documento, proponemos un nuevo modelo de red neuronal inspirado en la conocida teoría de codificación predictiva para hacer frente a estos problemas. La codificación predictiva proporciona un marco computacional interesante y confiable. Combinamos este enfoque con otras teorías, como la teoría de que la corteza cerebral oscila a diferentes frecuencias en diferentes niveles, para diseñar un modelo de red predictiva eficiente y confiable para la predicción de cuadros visuales. Específicamente, el modelo está compuesto por una serie de unidades recurrentes y convolucionales que forman las corrientes de arriba hacia abajo y de abajo hacia arriba, respectivamente. La frecuencia de actualización de las unidades neuronales en cada una de las capas disminuye con el aumento en el nivel de la red, lo que significa que las neuronas de un nivel más alto pueden capturar información en dimensiones temporales más largas. Según los resultados experimentales, este modelo mostró una mejor compacidad y un rendimiento predictivo comparable con los de trabajos existentes, lo que implica un menor costo computacional y una mayor precisión de predicción.