Dos-dimensional posicionamiento con aprendizaje automático en entornos virtuales y reales
Autores: Kóczi, Dávid; Németh, József; Sárosi, József
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Dos-dimensional posicionamiento con aprendizaje automático en entornos virtuales y reales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Red neuronal
Sistema de control
Aprendizaje por refuerzo
Servomotores
Sensor resistivo
Rendimiento en el mundo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En este documento se presenta un sistema de control de bola en placa impulsado únicamente por un agente de red neuronal. Aparte del aprendizaje por refuerzo, no se aplicó ninguna otra solución de control o soporte. El dispositivo implementado, impulsado por dos servomotores, aprendió por sí mismo a través de miles de iteraciones cómo mantener la bola en el centro del sensor resistivo. Comparamos el rendimiento en el mundo real de agentes entrenados tanto en un entorno real como en un entorno virtual. También examinamos la eficacia de un agente pre-entrenado virtualmente afinado en el entorno real. Los resultados obtenidos fueron evaluados y comparados para ver qué enfoque constituye una buena base para la implementación de una tarea de control implementada puramente con una red neuronal.
Descripción
En este documento se presenta un sistema de control de bola en placa impulsado únicamente por un agente de red neuronal. Aparte del aprendizaje por refuerzo, no se aplicó ninguna otra solución de control o soporte. El dispositivo implementado, impulsado por dos servomotores, aprendió por sí mismo a través de miles de iteraciones cómo mantener la bola en el centro del sensor resistivo. Comparamos el rendimiento en el mundo real de agentes entrenados tanto en un entorno real como en un entorno virtual. También examinamos la eficacia de un agente pre-entrenado virtualmente afinado en el entorno real. Los resultados obtenidos fueron evaluados y comparados para ver qué enfoque constituye una buena base para la implementación de una tarea de control implementada puramente con una red neuronal.