Control de la Dinámica de Qubits Usando Aprendizaje por Refuerzo
Autores: Koutromanos, Dimitris; Stefanatos, Dionisis; Paspalakis, Emmanuel
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Control de la Dinámica de Qubits Usando Aprendizaje por Refuerzo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje automático
Tecnología cuántica
Aprendizaje por refuerzo
Proceso de decisión de Markov
Aprendizaje profundo
Control cuántico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El progreso en el aprendizaje automático durante la última década ha tenido un impacto considerable en muchas áreas de la ciencia y la tecnología, incluida la tecnología cuántica. Este trabajo explora la aplicación de métodos de aprendizaje por refuerzo (RL) al problema de control cuántico de transferencia de estado en un solo qubit. El objetivo es crear un agente de RL que aprenda una política óptima y, por lo tanto, descubra pulsos óptimos para controlar el qubit. El paso más crucial es formular matemáticamente el problema de interés como un proceso de decisión de Markov (MDP). Esto permite el uso de algoritmos de RL para resolver el problema de control cuántico. El aprendizaje profundo y el uso de redes neuronales profundas proporcionan la libertad de emplear espacios de acción y estado continuos, ofreciendo la expresividad y generalización del proceso. Esta flexibilidad ayuda a formular el problema de transferencia de estado cuántico como un MDP de varias maneras diferentes. Todas las metodologías desarrolladas se aplican al problema fundamental de inversión de población en un qubit. En la mayoría de los casos, los pulsos óptimos derivados logran una fidelidad igual o superior a 0.9999, como se requiere en las aplicaciones de computación cuántica. Los métodos presentes pueden extenderse fácilmente a sistemas cuánticos con más niveles de energía y pueden utilizarse para el control eficiente de colecciones de qubits y para contrarrestar el efecto del ruido, que son temas importantes para las aplicaciones de detección cuántica.
Descripción
El progreso en el aprendizaje automático durante la última década ha tenido un impacto considerable en muchas áreas de la ciencia y la tecnología, incluida la tecnología cuántica. Este trabajo explora la aplicación de métodos de aprendizaje por refuerzo (RL) al problema de control cuántico de transferencia de estado en un solo qubit. El objetivo es crear un agente de RL que aprenda una política óptima y, por lo tanto, descubra pulsos óptimos para controlar el qubit. El paso más crucial es formular matemáticamente el problema de interés como un proceso de decisión de Markov (MDP). Esto permite el uso de algoritmos de RL para resolver el problema de control cuántico. El aprendizaje profundo y el uso de redes neuronales profundas proporcionan la libertad de emplear espacios de acción y estado continuos, ofreciendo la expresividad y generalización del proceso. Esta flexibilidad ayuda a formular el problema de transferencia de estado cuántico como un MDP de varias maneras diferentes. Todas las metodologías desarrolladas se aplican al problema fundamental de inversión de población en un qubit. En la mayoría de los casos, los pulsos óptimos derivados logran una fidelidad igual o superior a 0.9999, como se requiere en las aplicaciones de computación cuántica. Los métodos presentes pueden extenderse fácilmente a sistemas cuánticos con más niveles de energía y pueden utilizarse para el control eficiente de colecciones de qubits y para contrarrestar el efecto del ruido, que son temas importantes para las aplicaciones de detección cuántica.