ProtoPGTN: Una Red de Transformadores Gated Basada en Prototipos Escalable para la Clasificación Interpretable de Series Temporales
Autores: Huang, Jinjin; Guo, Ce; Luk, Wayne
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
ProtoPGTN: Una Red de Transformadores Gated Basada en Prototipos Escalable para la Clasificación Interpretable de Series Temporales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Clasificación de series temporales
Marco interpretable
Razonamiento de prototipos
Transformadores con compuertas
Escalable
Precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La clasificación de series temporales (TSC) juega un papel crucial en las aplicaciones de aprendizaje automático en dominios como la salud, las finanzas y los sistemas industriales. En estos dominios, TSC requiere predicciones precisas y explicaciones confiables, ya que las malas clasificaciones pueden llevar a consecuencias graves. Además, los problemas de escalabilidad, incluidos el tiempo de entrenamiento y el consumo de memoria, son críticos para el uso práctico. Para abordar estos desafíos, proponemos ProtoPGTN, un marco interpretable basado en prototipos que unifica transformadores con compuertas y razonamiento basado en prototipos para la clasificación escalable de series temporales. A diferencia de los modelos TSC interpretables basados en prototipos existentes que dependen de estructuras recurrentes para el procesamiento de secuencias y de la distancia euclidiana para el cálculo de similitudes, ProtoPGTN adapta las Redes de Transformadores con Compuertas (GTN), que utilizan un mecanismo de atención para capturar tanto las dependencias temporales como espaciales de largo alcance en los datos de series temporales e integra el marco de aprendizaje de prototipos de ProtoPNet con similitud coseno para mejorar la consistencia métrica y la interpretabilidad. Se realizan extensos experimentos en 165 conjuntos de datos disponibles públicamente de los repositorios UCR y UEA, cubriendo tanto tareas univariadas como multivariadas. Los resultados muestran que ProtoPGTN obtiene al menos el mismo rendimiento que los modelos interpretables basados en prototipos existentes en conjuntos de datos multivariados y univariados. La precisión promedio en conjuntos de datos multivariados y univariados se sitúa en 67.69% y 76.99%, respectivamente. ProtoPGTN logra hasta 20 veces un entrenamiento más rápido y hasta 200 veces un menor consumo de memoria que los modelos interpretables basados en prototipos existentes.
Descripción
La clasificación de series temporales (TSC) juega un papel crucial en las aplicaciones de aprendizaje automático en dominios como la salud, las finanzas y los sistemas industriales. En estos dominios, TSC requiere predicciones precisas y explicaciones confiables, ya que las malas clasificaciones pueden llevar a consecuencias graves. Además, los problemas de escalabilidad, incluidos el tiempo de entrenamiento y el consumo de memoria, son críticos para el uso práctico. Para abordar estos desafíos, proponemos ProtoPGTN, un marco interpretable basado en prototipos que unifica transformadores con compuertas y razonamiento basado en prototipos para la clasificación escalable de series temporales. A diferencia de los modelos TSC interpretables basados en prototipos existentes que dependen de estructuras recurrentes para el procesamiento de secuencias y de la distancia euclidiana para el cálculo de similitudes, ProtoPGTN adapta las Redes de Transformadores con Compuertas (GTN), que utilizan un mecanismo de atención para capturar tanto las dependencias temporales como espaciales de largo alcance en los datos de series temporales e integra el marco de aprendizaje de prototipos de ProtoPNet con similitud coseno para mejorar la consistencia métrica y la interpretabilidad. Se realizan extensos experimentos en 165 conjuntos de datos disponibles públicamente de los repositorios UCR y UEA, cubriendo tanto tareas univariadas como multivariadas. Los resultados muestran que ProtoPGTN obtiene al menos el mismo rendimiento que los modelos interpretables basados en prototipos existentes en conjuntos de datos multivariados y univariados. La precisión promedio en conjuntos de datos multivariados y univariados se sitúa en 67.69% y 76.99%, respectivamente. ProtoPGTN logra hasta 20 veces un entrenamiento más rápido y hasta 200 veces un menor consumo de memoria que los modelos interpretables basados en prototipos existentes.