Aprendizaje profundo de refuerzo consciente del riesgo para la navegación de multitudes de robots
Autores: Sun, Xueying; Zhang, Qiang; Wei, Yifei; Liu, Mingmin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje profundo de refuerzo consciente del riesgo para la navegación de multitudes de robots
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Seguro
Eficiente
Navegación
Aprendizaje profundo por refuerzo
Consciente del riesgo
Concurrido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
Asegurar una navegación segura y eficiente en entornos concurridos es un objetivo crítico para los robots de asistencia. Estudios recientes han destacado el potencial de las técnicas de aprendizaje profundo por refuerzo para mejorar las capacidades de navegación de los robots en presencia de multitudes. Sin embargo, los métodos actuales de aprendizaje profundo por refuerzo a menudo enfrentan el desafío de que los robots se congelen a medida que aumenta la densidad de la multitud. Para abordar este problema, en este documento se propone un enfoque novedoso de aprendizaje profundo por refuerzo consciente del riesgo. El método propuesto integra una función de riesgo para evaluar la probabilidad de colisión entre el robot y los peatones, lo que permite al robot priorizar proactivamente a los peatones con un mayor riesgo de colisión. Además, el modelo ajusta dinámicamente la estrategia de fusión de características basadas en el aprendizaje y conscientes del riesgo, mejorando así la robustez de la navegación del robot. Se realizaron evaluaciones para determinar la efectividad del método propuesto tanto en entornos de baja como de alta densidad de multitudes. Los resultados mostraron tasas de éxito de navegación notables del 98.0% y el 93.2% en entornos con 10 y 20 peatones, respectivamente. Estos hallazgos enfatizan el sólido rendimiento del método propuesto en la navegación exitosa a través de espacios concurridos. Además, el enfoque logra tiempos de navegación comparables a los de los métodos de última generación, confirmando su eficiencia en la realización de tareas de navegación. La capacidad de generalización del método también fue rigurosamente evaluada al someterlo a pruebas en entornos con multitudes que superan la densidad de entrenamiento. Notablemente, el método propuesto alcanza una impresionante tasa de éxito de navegación del 90.0% en entornos de 25 personas, superando el rendimiento de enfoques existentes y estableciéndose como una solución de última generación. Este resultado destaca la versatilidad y efectividad del método propuesto para adaptarse a diversas densidades de multitudes y refuerza aún más su aplicabilidad en escenarios del mundo real.
Descripción
Asegurar una navegación segura y eficiente en entornos concurridos es un objetivo crítico para los robots de asistencia. Estudios recientes han destacado el potencial de las técnicas de aprendizaje profundo por refuerzo para mejorar las capacidades de navegación de los robots en presencia de multitudes. Sin embargo, los métodos actuales de aprendizaje profundo por refuerzo a menudo enfrentan el desafío de que los robots se congelen a medida que aumenta la densidad de la multitud. Para abordar este problema, en este documento se propone un enfoque novedoso de aprendizaje profundo por refuerzo consciente del riesgo. El método propuesto integra una función de riesgo para evaluar la probabilidad de colisión entre el robot y los peatones, lo que permite al robot priorizar proactivamente a los peatones con un mayor riesgo de colisión. Además, el modelo ajusta dinámicamente la estrategia de fusión de características basadas en el aprendizaje y conscientes del riesgo, mejorando así la robustez de la navegación del robot. Se realizaron evaluaciones para determinar la efectividad del método propuesto tanto en entornos de baja como de alta densidad de multitudes. Los resultados mostraron tasas de éxito de navegación notables del 98.0% y el 93.2% en entornos con 10 y 20 peatones, respectivamente. Estos hallazgos enfatizan el sólido rendimiento del método propuesto en la navegación exitosa a través de espacios concurridos. Además, el enfoque logra tiempos de navegación comparables a los de los métodos de última generación, confirmando su eficiencia en la realización de tareas de navegación. La capacidad de generalización del método también fue rigurosamente evaluada al someterlo a pruebas en entornos con multitudes que superan la densidad de entrenamiento. Notablemente, el método propuesto alcanza una impresionante tasa de éxito de navegación del 90.0% en entornos de 25 personas, superando el rendimiento de enfoques existentes y estableciéndose como una solución de última generación. Este resultado destaca la versatilidad y efectividad del método propuesto para adaptarse a diversas densidades de multitudes y refuerza aún más su aplicabilidad en escenarios del mundo real.