Una Aplicación del Aprendizaje por Refuerzo al Diseño Óptimo de Sistemas de Suspensión de Vehículos de Carretera
Autores: De Santanna, Lorenzo; Malacrida, Riccardo; Mastinu, Gianpiero; Gobbi, Massimiliano
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Una Aplicación del Aprendizaje por Refuerzo al Diseño Óptimo de Sistemas de Suspensión de Vehículos de Carretera
Categoría
Procesos industriales
Subcategoría
Diseño de procesos industriales
Palabras clave
Estudio
Aprendizaje por refuerzo multiobjetivo basado en dominancia
Diseño óptimo
Sistemas mecánicos complejos
Gradiente de política determinista profunda
Optimización elasto-cinética
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 19
Citaciones: Sin citaciones
Este estudio investiga la aplicación del método de Aprendizaje por Refuerzo Multi-Objetivo Basado en Dominancia (MORL-DB) al diseño óptimo de sistemas mecánicos complejos. El método MORL-DB emplea un agente de Gradiente de Política Determinista Profunda (DDPG) para identificar las soluciones óptimas del problema multi-objetivo. Al adoptar la métrica de -optimalidad, que introduce un ranking de optimalidad dentro del conjunto de soluciones pareto-óptimas, se puede elegir una solución de diseño final más fácilmente, especialmente al considerar un gran número de funciones objetivo. El método se aplica con éxito a la optimización elasto-cinética de un sistema de suspensión de doble horquilla, que cuenta con un modelo multi-cuerpo en ADAMS Car. Esta tarea de diseño compleja incluye 30 variables de diseño y 14 funciones objetivo. El método MORL-DB se compara con otros dos enfoques: el método de Esferas Móviles (MS), desarrollado específicamente para tareas de diseño espacial, y el algoritmo genético con ordenación basada en -optimalidad (KEMOGA). Los resultados comparativos muestran que el método MORL-DB logra soluciones de mayor optimalidad mientras requiere significativamente menos evaluaciones de funciones objetivo. Los resultados demuestran que el método MORL-DB es una alternativa prometedora y eficiente en muestras para la optimización multi-objetivo, particularmente en problemas que involucran espacios de diseño de alta dimensión y evaluaciones costosas de funciones objetivo.
Descripción
Este estudio investiga la aplicación del método de Aprendizaje por Refuerzo Multi-Objetivo Basado en Dominancia (MORL-DB) al diseño óptimo de sistemas mecánicos complejos. El método MORL-DB emplea un agente de Gradiente de Política Determinista Profunda (DDPG) para identificar las soluciones óptimas del problema multi-objetivo. Al adoptar la métrica de -optimalidad, que introduce un ranking de optimalidad dentro del conjunto de soluciones pareto-óptimas, se puede elegir una solución de diseño final más fácilmente, especialmente al considerar un gran número de funciones objetivo. El método se aplica con éxito a la optimización elasto-cinética de un sistema de suspensión de doble horquilla, que cuenta con un modelo multi-cuerpo en ADAMS Car. Esta tarea de diseño compleja incluye 30 variables de diseño y 14 funciones objetivo. El método MORL-DB se compara con otros dos enfoques: el método de Esferas Móviles (MS), desarrollado específicamente para tareas de diseño espacial, y el algoritmo genético con ordenación basada en -optimalidad (KEMOGA). Los resultados comparativos muestran que el método MORL-DB logra soluciones de mayor optimalidad mientras requiere significativamente menos evaluaciones de funciones objetivo. Los resultados demuestran que el método MORL-DB es una alternativa prometedora y eficiente en muestras para la optimización multi-objetivo, particularmente en problemas que involucran espacios de diseño de alta dimensión y evaluaciones costosas de funciones objetivo.