No uniformización basada en discretización para regresión ordinal para estimación de profundidad monocula de un dron en interiores
Autores: Zhang, Xiangzhu; Zhang, Lijia; Lewis, Frank L.; Pei, Hailong
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
No uniformización basada en discretización para regresión ordinal para estimación de profundidad monocula de un dron en interiores
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Métodos
Estimación de profundidad monocular
Drones interiores
Algoritmo SLAM
Algoritmo de aprendizaje profundo
Algoritmo de regresión ordinal
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 44
Citaciones: Sin citaciones
Actualmente, los principales métodos para resolver la estimación de profundidad monocular para drones en interiores son el algoritmo de localización y mapeo simultáneo (SLAM) y el algoritmo de aprendizaje profundo. SLAM requiere la construcción de un mapa de profundidad del entorno desconocido, lo cual es lento de calcular y generalmente requiere sensores costosos, mientras que los algoritmos actuales de aprendizaje profundo se basan principalmente en clasificación binaria o regresión. El modelo de clasificación binaria da al algoritmo de decisión un control relativamente aproximado sobre el vehículo aéreo no tripulado. El modelo de regresión resuelve el problema de la clasificación binaria, pero realiza el mismo procesamiento para distancias largas y cortas, lo que resulta en un deterioro del rendimiento de predicción a corta distancia. Para resolver los problemas anteriores, según las características de la fuerte correlación de orden del valor de la distancia, proponemos un algoritmo de regresión ordinal basado en discretización con espaciado no uniforme (NSIDORA) para resolver la estimación de profundidad monocular para tareas de drones en interiores. Según los requisitos de seguridad de esta tarea, la etiqueta de distancia del conjunto de datos se discretiza en tres áreas principales: área peligrosa, área de decisión y área de seguridad, y el área de decisión se discretiza en función de la discretización con espaciado no uniforme. Considerando la inconsistencia de la regresión ordinal, se produce un nuevo decodificador de distancia. La evaluación experimental muestra que el error cuadrático medio (RMSE) de NSIDORA en el área de decisión es un 33.5% más bajo que el de los métodos de regresión ordinal basados en discretización no uniforme (NUD). Aunque es más alto en general que el del algoritmo de regresión de dos flujos más avanzado, el RMSE de NSIDORA en las 10 principales categorías del área de decisión es un 21.8% más bajo que el del algoritmo de regresión de dos flujos. La velocidad de inferencia de NSIDORA es 3.4 veces más rápida que la de la regresión ordinal de dos flujos. Además, la efectividad del decodificador ha sido demostrada a través de experimentos de ablación.
Descripción
Actualmente, los principales métodos para resolver la estimación de profundidad monocular para drones en interiores son el algoritmo de localización y mapeo simultáneo (SLAM) y el algoritmo de aprendizaje profundo. SLAM requiere la construcción de un mapa de profundidad del entorno desconocido, lo cual es lento de calcular y generalmente requiere sensores costosos, mientras que los algoritmos actuales de aprendizaje profundo se basan principalmente en clasificación binaria o regresión. El modelo de clasificación binaria da al algoritmo de decisión un control relativamente aproximado sobre el vehículo aéreo no tripulado. El modelo de regresión resuelve el problema de la clasificación binaria, pero realiza el mismo procesamiento para distancias largas y cortas, lo que resulta en un deterioro del rendimiento de predicción a corta distancia. Para resolver los problemas anteriores, según las características de la fuerte correlación de orden del valor de la distancia, proponemos un algoritmo de regresión ordinal basado en discretización con espaciado no uniforme (NSIDORA) para resolver la estimación de profundidad monocular para tareas de drones en interiores. Según los requisitos de seguridad de esta tarea, la etiqueta de distancia del conjunto de datos se discretiza en tres áreas principales: área peligrosa, área de decisión y área de seguridad, y el área de decisión se discretiza en función de la discretización con espaciado no uniforme. Considerando la inconsistencia de la regresión ordinal, se produce un nuevo decodificador de distancia. La evaluación experimental muestra que el error cuadrático medio (RMSE) de NSIDORA en el área de decisión es un 33.5% más bajo que el de los métodos de regresión ordinal basados en discretización no uniforme (NUD). Aunque es más alto en general que el del algoritmo de regresión de dos flujos más avanzado, el RMSE de NSIDORA en las 10 principales categorías del área de decisión es un 21.8% más bajo que el del algoritmo de regresión de dos flujos. La velocidad de inferencia de NSIDORA es 3.4 veces más rápida que la de la regresión ordinal de dos flujos. Además, la efectividad del decodificador ha sido demostrada a través de experimentos de ablación.