Técnicas básicas de aprendizaje por refuerzo para controlar la intensidad de un láser de electrones libre sembrado
Autores: Bruchon, Niky; Fenu, Gianfranco; Gaio, Giulio; Lonza, Marco; O"Shea, Finn Henry; Pellegrino, Felice Andrea; Salvato, Erica
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Técnicas básicas de aprendizaje por refuerzo para controlar la intensidad de un láser de electrones libre sembrado
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aceleradores de partículas
Aprendizaje automático
Aprendizaje por refuerzo
Optimización del rendimiento
Láser de electrones libres
Láser semilla
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La sintonización óptima de aceleradores de partículas es una tarea desafiante. Muchos enfoques diferentes han sido propuestos en el pasado para resolver dos problemas principales: la consecución de un punto de trabajo óptimo y la recuperación del rendimiento después de desviaciones en la máquina. Las técnicas más clásicas sin modelo (por ejemplo, algoritmos de Ascenso de Gradiente o Búsqueda de Extremos) tienen algunas limitaciones intrínsecas. Para superar esas limitaciones, las herramientas de Aprendizaje Automático, en particular el Aprendizaje por Refuerzo (RL por sus siglas en inglés), están atrayendo cada vez más la atención en la comunidad de aceleradores de partículas. Investigamos la viabilidad de enfoques sin modelo de RL para alinear el láser semilla, así como otros láseres de servicio, en FERMI, la instalación de láser de electrones libres en Elettra Sincrotrone Trieste. Aplicamos dos técnicas diferentes: la primera, basada en el Q-learning episódico con aproximación lineal de funciones, para la optimización del rendimiento; la segunda, basada en el algoritmo continuo de Gradiente de Política Natural REINFORCE, para la recuperación del rendimiento. A pesar de la simplicidad de estos enfoques, informamos resultados preliminares satisfactorios, que representan el primer paso hacia un nuevo procedimiento completamente automático para la alineación del láser semilla con el haz de electrones. Actualmente, dicha alineación se realiza manualmente.
Descripción
La sintonización óptima de aceleradores de partículas es una tarea desafiante. Muchos enfoques diferentes han sido propuestos en el pasado para resolver dos problemas principales: la consecución de un punto de trabajo óptimo y la recuperación del rendimiento después de desviaciones en la máquina. Las técnicas más clásicas sin modelo (por ejemplo, algoritmos de Ascenso de Gradiente o Búsqueda de Extremos) tienen algunas limitaciones intrínsecas. Para superar esas limitaciones, las herramientas de Aprendizaje Automático, en particular el Aprendizaje por Refuerzo (RL por sus siglas en inglés), están atrayendo cada vez más la atención en la comunidad de aceleradores de partículas. Investigamos la viabilidad de enfoques sin modelo de RL para alinear el láser semilla, así como otros láseres de servicio, en FERMI, la instalación de láser de electrones libres en Elettra Sincrotrone Trieste. Aplicamos dos técnicas diferentes: la primera, basada en el Q-learning episódico con aproximación lineal de funciones, para la optimización del rendimiento; la segunda, basada en el algoritmo continuo de Gradiente de Política Natural REINFORCE, para la recuperación del rendimiento. A pesar de la simplicidad de estos enfoques, informamos resultados preliminares satisfactorios, que representan el primer paso hacia un nuevo procedimiento completamente automático para la alineación del láser semilla con el haz de electrones. Actualmente, dicha alineación se realiza manualmente.