Un Análisis Comparativo de Modelos de Aprendizaje Automático para la Detección de Anomalías en Datos de Series Temporales de Medidores Inteligentes Industriales
Autores: Amirkhanova, Gulshat; Aidynuly, Azim; Adilzhanova, Saltanat; Fu, Yanwei; Dina, Baizhanova; Alipbeki, Onggarbek
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un Análisis Comparativo de Modelos de Aprendizaje Automático para la Detección de Anomalías en Datos de Series Temporales de Medidores Inteligentes Industriales
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Infraestructura de medición avanzada
Datos eléctricos
Anomalías
Modelos de aprendizaje automático
Auto-codificador LSTM
Detección de anomalías
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La integración de la Infraestructura de Medición Avanzada (AMI) proporciona datos eléctricos de alta resolución, esenciales para mejorar la eficiencia industrial y monitorear la salud del equipo. Sin embargo, la utilidad de estos datos se ve frecuentemente comprometida por anomalías, lo que subraya la necesidad de metodologías de detección robustas y automatizadas. Este estudio evalúa tres categorías distintas de modelos de aprendizaje automático: una línea base estadística (SARIMA), un clasificador no supervisado (Isolation Forest) y un modelo de reconstrucción de aprendizaje profundo (LSTM-Autoencoder). La evaluación se llevó a cabo utilizando un conjunto de datos multivariado adquirido de equipos de fabricación de panadería, empleando un marco de inyección de anomalías sintéticas con una tasa de contaminación del 5%. Los resultados indican desafíos significativos para detectar anomalías con precisión dentro de este conjunto de datos. El modelo SARIMA logró el F1-Score promedio más alto (0.256), superando ligeramente al Isolation Forest (0.233), mientras que el LSTM-Autoencoder tuvo el peor rendimiento (0.110). Críticamente, todos los modelos exhibieron una precisión extremadamente baja (que oscila entre 0.074 y 0.204), lo que indica una tasa inaceptablemente alta de falsos positivos. Los hallazgos sugieren que las configuraciones estándar de estos modelos tienen dificultades para diferenciar entre verdaderas anomalías y la variabilidad inherente de las operaciones industriales, destacando la necesidad de optimización avanzada e ingeniería de características para un despliegue práctico.
Descripción
La integración de la Infraestructura de Medición Avanzada (AMI) proporciona datos eléctricos de alta resolución, esenciales para mejorar la eficiencia industrial y monitorear la salud del equipo. Sin embargo, la utilidad de estos datos se ve frecuentemente comprometida por anomalías, lo que subraya la necesidad de metodologías de detección robustas y automatizadas. Este estudio evalúa tres categorías distintas de modelos de aprendizaje automático: una línea base estadística (SARIMA), un clasificador no supervisado (Isolation Forest) y un modelo de reconstrucción de aprendizaje profundo (LSTM-Autoencoder). La evaluación se llevó a cabo utilizando un conjunto de datos multivariado adquirido de equipos de fabricación de panadería, empleando un marco de inyección de anomalías sintéticas con una tasa de contaminación del 5%. Los resultados indican desafíos significativos para detectar anomalías con precisión dentro de este conjunto de datos. El modelo SARIMA logró el F1-Score promedio más alto (0.256), superando ligeramente al Isolation Forest (0.233), mientras que el LSTM-Autoencoder tuvo el peor rendimiento (0.110). Críticamente, todos los modelos exhibieron una precisión extremadamente baja (que oscila entre 0.074 y 0.204), lo que indica una tasa inaceptablemente alta de falsos positivos. Los hallazgos sugieren que las configuraciones estándar de estos modelos tienen dificultades para diferenciar entre verdaderas anomalías y la variabilidad inherente de las operaciones industriales, destacando la necesidad de optimización avanzada e ingeniería de características para un despliegue práctico.