logo móvil
Contáctanos

Evaluaciones Auto-Generadas para la Autonomía del Robot Basadas en la Entrada de Sensores

Autores: Sakamoto, Yuma; Kurashige, Kentarou

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Evaluaciones Auto-Generadas para la Autonomía del Robot Basadas en la Entrada de Sensores


Categoría

Tecnología de Equipos y Accesorios

Subcategoría

Diseño de equipos y herramientas

Palabras clave

Aprendizaje por refuerzo
Función de recompensa
Operación de robots
Información de sensores
Método de diseño de recompensas
Problema de búsqueda de caminos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
El aprendizaje por refuerzo se ha explorado en el contexto de la operación de robots en diferentes entornos. Diseñar la función de recompensa en el aprendizaje por refuerzo es un desafío para los diseñadores porque requiere conocimientos especializados. Para reducir la carga de diseño, proponemos un método de diseño de recompensas que es independiente de entornos y tareas específicas en las que los robots de aprendizaje por refuerzo evalúan y generan recompensas de manera autónoma basándose en la información de los sensores recibida del entorno. Este método permite que el robot opere de manera autónoma en función de los sensores. Sin embargo, el enfoque existente para la adaptación intenta adaptarse sin considerar las propiedades de entrada para la fuerza de la entrada del sensor, lo que puede hacer que un robot aprenda acciones perjudiciales del entorno. En este estudio, proponemos un método para cambiar el umbral de la entrada del sensor considerando la fuerza de la entrada y otras propiedades. También demostramos la utilidad del método propuesto presentando los resultados de experimentos de simulación sobre un problema de búsqueda de caminos realizado en un entorno con recompensas escasas.

Otros recursos que podrían interesarte

Temas Virtualpro