Navegación de Robots Adaptativa Usando Selección Aleatoria de Objetivos con Gradiente de Políticas Deterministas Retrasadas Gemelas
Autores: Ali, Romisaa; Dogru, Sedat; Marques, Lino; Chiaberge, Marcello
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Navegación de Robots Adaptativa Usando Selección Aleatoria de Objetivos con Gradiente de Políticas Deterministas Retrasadas Gemelas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Navegación robótica
Adaptabilidad
Modelo TD3
Inicio aleatorio
Puntos de objetivo
Entornos no vistos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 15
Citaciones: Sin citaciones
El principal desafío en la navegación robótica radica en permitir que los robots se adapten de manera efectiva a nuevos entornos no vistos. Abordando esta brecha, este artículo mejora la adaptabilidad del modelo Twin Delayed Deep Deterministic Policy Gradient (TD3) al introducir puntos de inicio y de meta aleatorios. Este enfoque tiene como objetivo superar las limitaciones de los puntos de meta fijos utilizados en investigaciones anteriores, permitiendo que el robot navegue de manera más efectiva a través de escenarios impredecibles. Esta extensión propuesta fue evaluada en entornos no vistos para validar la adaptabilidad y el rendimiento mejorados del modelo TD3. Los resultados experimentales destacan una mayor flexibilidad y robustez en las capacidades de navegación del robot, demostrando la capacidad del modelo para generalizar de manera efectiva a entornos no vistos. Además, este artículo proporciona una visión general concisa de TD3, centrándose en sus mecanismos centrales y componentes clave para aclarar su implementación.
Descripción
El principal desafío en la navegación robótica radica en permitir que los robots se adapten de manera efectiva a nuevos entornos no vistos. Abordando esta brecha, este artículo mejora la adaptabilidad del modelo Twin Delayed Deep Deterministic Policy Gradient (TD3) al introducir puntos de inicio y de meta aleatorios. Este enfoque tiene como objetivo superar las limitaciones de los puntos de meta fijos utilizados en investigaciones anteriores, permitiendo que el robot navegue de manera más efectiva a través de escenarios impredecibles. Esta extensión propuesta fue evaluada en entornos no vistos para validar la adaptabilidad y el rendimiento mejorados del modelo TD3. Los resultados experimentales destacan una mayor flexibilidad y robustez en las capacidades de navegación del robot, demostrando la capacidad del modelo para generalizar de manera efectiva a entornos no vistos. Además, este artículo proporciona una visión general concisa de TD3, centrándose en sus mecanismos centrales y componentes clave para aclarar su implementación.