Control de seguimiento de pared de robot móvil utilizando controlador de lógica difusa con búsqueda diferencial mejorada y aprendizaje por refuerzo
Autores: Chen, Cheng-Hung; Jeng, Shiou-Yun; Lin, Cheng-Jian
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Control de seguimiento de pared de robot móvil utilizando controlador de lógica difusa con búsqueda diferencial mejorada y aprendizaje por refuerzo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Controlador de lógica difusa
Aprendizaje por refuerzo
Algoritmo de búsqueda diferencial
Robot móvil
Control de seguimiento de pared
Resultados experimentales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 37
Citaciones: Sin citaciones
En este estudio, se propone un controlador de lógica difusa con el algoritmo de búsqueda diferencial mejorado por refuerzo (FLC_R-IDS) para resolver un problema de control de seguimiento de pared de robot móvil. Este estudio utiliza los mecanismos de recompensa y castigo del aprendizaje por refuerzo para entrenar el control de seguimiento de pared del robot móvil. El algoritmo de búsqueda diferencial mejorado propuesto utiliza adaptación de parámetros para ajustar los parámetros de control. Para mejorar la exploración del algoritmo, se requiere un cambio en el número de superorganismos, ya que implica un sitio de escala. Este estudio utiliza el aprendizaje por refuerzo para guiar el comportamiento del robot. Cuando el robot móvil cumple tres condiciones de recompensa, recibe una recompensa +1. El valor de recompensa acumulado se utiliza para evaluar el controlador y reemplazar el siguiente entrenamiento del controlador. Los resultados experimentales muestran que, en comparación con el algoritmo de búsqueda diferencial tradicional y el algoritmo de búsqueda diferencial de caos, el valor de error promedio del FLC_R-IDS propuesto en los tres entornos experimentales se reduce en un 12.44%, 22.54% y 25.98%, respectivamente. Finalmente, los resultados experimentales también muestran que el robot móvil real que utiliza el método propuesto puede implementar efectivamente el control de seguimiento de pared.
Descripción
En este estudio, se propone un controlador de lógica difusa con el algoritmo de búsqueda diferencial mejorado por refuerzo (FLC_R-IDS) para resolver un problema de control de seguimiento de pared de robot móvil. Este estudio utiliza los mecanismos de recompensa y castigo del aprendizaje por refuerzo para entrenar el control de seguimiento de pared del robot móvil. El algoritmo de búsqueda diferencial mejorado propuesto utiliza adaptación de parámetros para ajustar los parámetros de control. Para mejorar la exploración del algoritmo, se requiere un cambio en el número de superorganismos, ya que implica un sitio de escala. Este estudio utiliza el aprendizaje por refuerzo para guiar el comportamiento del robot. Cuando el robot móvil cumple tres condiciones de recompensa, recibe una recompensa +1. El valor de recompensa acumulado se utiliza para evaluar el controlador y reemplazar el siguiente entrenamiento del controlador. Los resultados experimentales muestran que, en comparación con el algoritmo de búsqueda diferencial tradicional y el algoritmo de búsqueda diferencial de caos, el valor de error promedio del FLC_R-IDS propuesto en los tres entornos experimentales se reduce en un 12.44%, 22.54% y 25.98%, respectivamente. Finalmente, los resultados experimentales también muestran que el robot móvil real que utiliza el método propuesto puede implementar efectivamente el control de seguimiento de pared.