Estimación de profundidad monocular rápida y de alta calidad con flujo óptico para drones autónomos
Autores: Shimada, Tomoyasu; Nishikawa, Hiroki; Kong, Xiangbo; Tomiyama, Hiroyuki
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Estimación de profundidad monocular rápida y de alta calidad con flujo óptico para drones autónomos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones autónomos
Estimación de profundidad
Modelos de CNN
Flujo óptico
Tiempo de inferencia
Evitación de colisiones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, los drones autónomos han atraído la atención en muchos campos debido a su conveniencia. Los drones autónomos requieren información de profundidad precisa para evitar colisiones y volar rápido, y tanto la imagen RGB como la nube de puntos LiDAR se emplean a menudo en aplicaciones basadas en Redes Neuronales Convolucionales (CNN) para estimar la distancia a los obstáculos. Tales aplicaciones se implementan a bordo de sistemas embebidos. Para estimar la profundidad de manera precisa, estos modelos de CNN son en general tan complejos que extraen muchas características, lo que aumenta la complejidad computacional y requiere un largo tiempo de inferencia. Para resolver este problema, empleamos flujo óptico para ayudar en la estimación de profundidad. Además, proponemos una nueva estructura de atención que hace el máximo uso del flujo óptico sin complicar la red. Además, logramos un mejor rendimiento sin modificar el estimador de profundidad al agregar un discriminador perceptual en el entrenamiento. El modelo propuesto se evalúa a través de precisión, error y tiempo de inferencia en el conjunto de datos KITTI. En los experimentos, hemos demostrado que el método propuesto logra un mejor rendimiento de hasta un 34% de precisión, una reducción del 55% en el error y un tiempo de inferencia un 66% más rápido en Jetson nano en comparación con métodos anteriores. El método propuesto también se evalúa a través de la evitación de colisiones en vuelos de drones simulados y logra la tasa de colisión más baja de todos los métodos de estimación. Estos resultados experimentales muestran el potencial del método propuesto para ser utilizado en aplicaciones de vuelo de drones autónomos en el mundo real.
Descripción
En los últimos años, los drones autónomos han atraído la atención en muchos campos debido a su conveniencia. Los drones autónomos requieren información de profundidad precisa para evitar colisiones y volar rápido, y tanto la imagen RGB como la nube de puntos LiDAR se emplean a menudo en aplicaciones basadas en Redes Neuronales Convolucionales (CNN) para estimar la distancia a los obstáculos. Tales aplicaciones se implementan a bordo de sistemas embebidos. Para estimar la profundidad de manera precisa, estos modelos de CNN son en general tan complejos que extraen muchas características, lo que aumenta la complejidad computacional y requiere un largo tiempo de inferencia. Para resolver este problema, empleamos flujo óptico para ayudar en la estimación de profundidad. Además, proponemos una nueva estructura de atención que hace el máximo uso del flujo óptico sin complicar la red. Además, logramos un mejor rendimiento sin modificar el estimador de profundidad al agregar un discriminador perceptual en el entrenamiento. El modelo propuesto se evalúa a través de precisión, error y tiempo de inferencia en el conjunto de datos KITTI. En los experimentos, hemos demostrado que el método propuesto logra un mejor rendimiento de hasta un 34% de precisión, una reducción del 55% en el error y un tiempo de inferencia un 66% más rápido en Jetson nano en comparación con métodos anteriores. El método propuesto también se evalúa a través de la evitación de colisiones en vuelos de drones simulados y logra la tasa de colisión más baja de todos los métodos de estimación. Estos resultados experimentales muestran el potencial del método propuesto para ser utilizado en aplicaciones de vuelo de drones autónomos en el mundo real.