Aprendizaje por Refuerzo para la Presión de Soporte Facial de Máquinas Tuneladoras
Autores: Soranzo, Enrico; Guardiani, Carlotta; Wu, Wei
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Aprendizaje por Refuerzo para la Presión de Soporte Facial de Máquinas Tuneladoras
Categoría
Ciencias Naturales y Subdisciplinas
Subcategoría
Ciencias de la Tierra y Geología
Palabras clave
Excavación de túneles
Máquinas de perforación
Aprendizaje por refuerzo
Algoritmo de red Q profunda
Presión de soporte en la cara
Asentamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 14
Citaciones: Sin citaciones
En la excavación de túneles con máquinas de perforación, la cara del túnel se apoya para evitar colapsos y minimizar el asentamiento. Este artículo propone el uso de aprendizaje por refuerzo, específicamente el algoritmo de red Q profunda, para predecir la presión de soporte de la cara. El algoritmo utiliza una red neuronal para tomar decisiones basadas en las recompensas esperadas de cada acción. El enfoque se prueba tanto de manera analítica como numérica. Al utilizar las propiedades del suelo frente a la cara del túnel y la profundidad de la sobrecarga como entrada, el algoritmo es capaz de predecir la presión óptima de soporte de la cara del túnel mientras minimiza el asentamiento y se adapta a los cambios en las condiciones geológicas y geométricas. El algoritmo alcanza un rendimiento máximo después de 400 episodios de entrenamiento y puede ser utilizado para configuraciones geológicas aleatorias sin necesidad de reentrenamiento.
Descripción
En la excavación de túneles con máquinas de perforación, la cara del túnel se apoya para evitar colapsos y minimizar el asentamiento. Este artículo propone el uso de aprendizaje por refuerzo, específicamente el algoritmo de red Q profunda, para predecir la presión de soporte de la cara. El algoritmo utiliza una red neuronal para tomar decisiones basadas en las recompensas esperadas de cada acción. El enfoque se prueba tanto de manera analítica como numérica. Al utilizar las propiedades del suelo frente a la cara del túnel y la profundidad de la sobrecarga como entrada, el algoritmo es capaz de predecir la presión óptima de soporte de la cara del túnel mientras minimiza el asentamiento y se adapta a los cambios en las condiciones geológicas y geométricas. El algoritmo alcanza un rendimiento máximo después de 400 episodios de entrenamiento y puede ser utilizado para configuraciones geológicas aleatorias sin necesidad de reentrenamiento.