Análisis de atribución de un conductor de autopista basado en aprendizaje por refuerzo
Autores: Pankiewicz, Nikodem; Kowalczyk, Pawe
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Análisis de atribución de un conductor de autopista basado en aprendizaje por refuerzo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Modelos de aprendizaje automático
Aprendizaje profundo por refuerzo
Seguridad
Planificación de movimiento de vehículos
Análisis estadístico
Características de entrada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
Si bien los modelos de aprendizaje automático están impulsando cada vez más dispositivos cotidianos, existe una creciente necesidad de explicarlos. Esto se aplica especialmente al uso del aprendizaje profundo por refuerzo en soluciones que requieren seguridad, como la planificación de movimiento de vehículos. En este documento, proponemos un método para comprender en qué se basa la decisión del agente de RL. El método se basa en realizar un análisis estadístico en un conjunto masivo de muestras de decisiones de estado. Indica qué características de entrada tienen un impacto en la decisión del agente y las relaciones entre las decisiones, la importancia de las características de entrada y sus valores. El método nos permite determinar si el proceso de toma de decisiones por parte del agente es coherente con la intuición humana y qué la contradice. Aplicamos el método propuesto al agente de planificación de movimiento de RL que se supone debe conducir un vehículo de manera segura y eficiente en una autopista. Descubrimos que realizar dicho análisis permite una mejor comprensión de las decisiones del agente, inspeccionar su comportamiento, depurar el modelo de ANN y verificar la corrección de los valores de entrada, lo que aumenta su credibilidad.
Descripción
Si bien los modelos de aprendizaje automático están impulsando cada vez más dispositivos cotidianos, existe una creciente necesidad de explicarlos. Esto se aplica especialmente al uso del aprendizaje profundo por refuerzo en soluciones que requieren seguridad, como la planificación de movimiento de vehículos. En este documento, proponemos un método para comprender en qué se basa la decisión del agente de RL. El método se basa en realizar un análisis estadístico en un conjunto masivo de muestras de decisiones de estado. Indica qué características de entrada tienen un impacto en la decisión del agente y las relaciones entre las decisiones, la importancia de las características de entrada y sus valores. El método nos permite determinar si el proceso de toma de decisiones por parte del agente es coherente con la intuición humana y qué la contradice. Aplicamos el método propuesto al agente de planificación de movimiento de RL que se supone debe conducir un vehículo de manera segura y eficiente en una autopista. Descubrimos que realizar dicho análisis permite una mejor comprensión de las decisiones del agente, inspeccionar su comportamiento, depurar el modelo de ANN y verificar la corrección de los valores de entrada, lo que aumenta su credibilidad.