Diseño de algoritmo de evasión de obstáculos multimodal basado en aprendizaje profundo por refuerzo
Autores: Zhu, Wenming; Gao, Xuan; Wu, Haibin; Chen, Jiawei; Zhou, Xuehua; Zhou, Zhiguo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Diseño de algoritmo de evasión de obstáculos multimodal basado en aprendizaje profundo por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Navegación
Evasión de obstáculos
Aprendizaje profundo por refuerzo
Información multimodal
Segmentación de imágenes
Algoritmo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
El método de evasión de obstáculos de navegación basado en aprendizaje profundo por refuerzo tiene una mayor adaptabilidad y mejor rendimiento en comparación con algoritmos tradicionales en entornos dinámicos desconocidos complejos, y ha sido ampliamente desarrollado y aplicado. Sin embargo, al utilizar información multimodal de entrada, las redes de estrategia de aprendizaje profundo extraen características que difieren significativamente entre entornos simulados y del mundo real, lo que resulta en estrategias de salida de algoritmo deficientes y dificultad para transferir modelos obtenidos del entrenamiento de simulación a entornos reales. Para abordar los problemas mencionados, este artículo utiliza la segmentación de imágenes para reducir la brecha en las características ambientales, integra información multimodal y diseña un algoritmo de evasión de obstáculos local multimodal de aprendizaje profundo, MMSEG-PPO, basado en algoritmos de optimización de estrategias proximales. Luego, el algoritmo se traslada a entornos prácticos para su despliegue y prueba. El experimento muestra que el algoritmo propuesto en este artículo reduce la brecha entre el entorno de simulación y el entorno real, y tiene un mejor rendimiento y generalización al ser trasplantado al entorno del mundo real.
Descripción
El método de evasión de obstáculos de navegación basado en aprendizaje profundo por refuerzo tiene una mayor adaptabilidad y mejor rendimiento en comparación con algoritmos tradicionales en entornos dinámicos desconocidos complejos, y ha sido ampliamente desarrollado y aplicado. Sin embargo, al utilizar información multimodal de entrada, las redes de estrategia de aprendizaje profundo extraen características que difieren significativamente entre entornos simulados y del mundo real, lo que resulta en estrategias de salida de algoritmo deficientes y dificultad para transferir modelos obtenidos del entrenamiento de simulación a entornos reales. Para abordar los problemas mencionados, este artículo utiliza la segmentación de imágenes para reducir la brecha en las características ambientales, integra información multimodal y diseña un algoritmo de evasión de obstáculos local multimodal de aprendizaje profundo, MMSEG-PPO, basado en algoritmos de optimización de estrategias proximales. Luego, el algoritmo se traslada a entornos prácticos para su despliegue y prueba. El experimento muestra que el algoritmo propuesto en este artículo reduce la brecha entre el entorno de simulación y el entorno real, y tiene un mejor rendimiento y generalización al ser trasplantado al entorno del mundo real.