logo móvil
Contáctanos

Navegación de Robots Adaptativa Usando Selección Aleatoria de Objetivos con Gradiente de Políticas Deterministas Retrasadas Gemelas

Autores: Ali, Romisaa; Dogru, Sedat; Marques, Lino; Chiaberge, Marcello

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

Navegación de Robots Adaptativa Usando Selección Aleatoria de Objetivos con Gradiente de Políticas Deterministas Retrasadas Gemelas


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Navegación robótica
Adaptabilidad
Modelo TD3
Inicio aleatorio
Puntos de objetivo
Entornos no vistos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 15

Citaciones: Sin citaciones


Descripción
El principal desafío en la navegación robótica radica en permitir que los robots se adapten de manera efectiva a nuevos entornos no vistos. Abordando esta brecha, este artículo mejora la adaptabilidad del modelo Twin Delayed Deep Deterministic Policy Gradient (TD3) al introducir puntos de inicio y de meta aleatorios. Este enfoque tiene como objetivo superar las limitaciones de los puntos de meta fijos utilizados en investigaciones anteriores, permitiendo que el robot navegue de manera más efectiva a través de escenarios impredecibles. Esta extensión propuesta fue evaluada en entornos no vistos para validar la adaptabilidad y el rendimiento mejorados del modelo TD3. Los resultados experimentales destacan una mayor flexibilidad y robustez en las capacidades de navegación del robot, demostrando la capacidad del modelo para generalizar de manera efectiva a entornos no vistos. Además, este artículo proporciona una visión general concisa de TD3, centrándose en sus mecanismos centrales y componentes clave para aclarar su implementación.

Otros recursos que podrían interesarte

Temas Virtualpro