Lpnet: red neuronal inspirada en la retina para detección y reconocimiento de objetos
Autores: Cao, Jie; Bao, Chun; Hao, Qun; Cheng, Yang; Chen, Chenglin
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Lpnet: red neuronal inspirada en la retina para detección y reconocimiento de objetos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de objetos rotados
Modelos de aprendizaje profundo
LPNet
Rotación de objetos
Transformación log-polar
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La detección de objetos rotados es un trabajo de investigación significativo y desafiante. Aunque los modelos de aprendizaje profundo de última generación tienen invarianza de características, especialmente las redes neuronales convolucionales (CNN), sus arquitecturas no fueron diseñadas específicamente para la invarianza de rotación. Solo compensan ligeramente esta característica a través de capas de agrupación. En este estudio, proponemos una red novedosa, llamada LPNet, para resolver el problema de la rotación de objetos. LPNet mejora la precisión de detección al combinar la transformación log-polar similar a la retina. Además, LPNet es una arquitectura plug-and-play para la detección y reconocimiento de objetos. Consta de dos partes, a las que llamamos codificador y decodificador. Un codificador extrae imágenes con características en coordenadas log-polar, mientras que un decodificador elimina el ruido de imagen en coordenadas cartesianas. Además, según el movimiento de los puntos centrales, LPNet tiene modos estables y deslizantes. LPNet toma la red de detector de caja única multiescala (SSD) como red base y el grupo de geometría visual (VGG16) como red de extracción de características. Los resultados experimentales muestran que, en comparación con las redes SSD convencionales, la precisión media promedio (mAP) de LPNet aumentó un 3,4% para objetos regulares y un 17,6% para objetos rotados.
Descripción
La detección de objetos rotados es un trabajo de investigación significativo y desafiante. Aunque los modelos de aprendizaje profundo de última generación tienen invarianza de características, especialmente las redes neuronales convolucionales (CNN), sus arquitecturas no fueron diseñadas específicamente para la invarianza de rotación. Solo compensan ligeramente esta característica a través de capas de agrupación. En este estudio, proponemos una red novedosa, llamada LPNet, para resolver el problema de la rotación de objetos. LPNet mejora la precisión de detección al combinar la transformación log-polar similar a la retina. Además, LPNet es una arquitectura plug-and-play para la detección y reconocimiento de objetos. Consta de dos partes, a las que llamamos codificador y decodificador. Un codificador extrae imágenes con características en coordenadas log-polar, mientras que un decodificador elimina el ruido de imagen en coordenadas cartesianas. Además, según el movimiento de los puntos centrales, LPNet tiene modos estables y deslizantes. LPNet toma la red de detector de caja única multiescala (SSD) como red base y el grupo de geometría visual (VGG16) como red de extracción de características. Los resultados experimentales muestran que, en comparación con las redes SSD convencionales, la precisión media promedio (mAP) de LPNet aumentó un 3,4% para objetos regulares y un 17,6% para objetos rotados.