Aprendizaje para diagnosticar: meta-aprendizaje para adaptación eficiente en escenarios de AIOps de pocos disparos
Autores: Duan, Yunfeng; Bao, Haotong; Bai, Guotao; Wei, Yadong; Xue, Kaiwen; You, Zhangzheng; Zhang, Yuantian; Liu, Bin; Chen, Jiaxing; Wang, Shenhuan; Ou, Zhonghong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aprendizaje para diagnosticar: meta-aprendizaje para adaptación eficiente en escenarios de AIOps de pocos disparos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnologías
Complejidad
AIOps
Inteligencia artificial
Big data
Detección de anomalías
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
Con el avance de tecnologías como 5G, la computación en la nube y los microservicios, la complejidad de los sistemas de gestión de redes y la variedad de componentes técnicos han aumentado considerablemente. Este aumento en la complejidad ha hecho que los métodos tradicionales de operaciones y mantenimiento sean insuficientes para satisfacer las demandas actuales de monitoreo y mantenimiento. En consecuencia, la inteligencia artificial para operaciones de TI (AIOps), que aprovecha las tecnologías de inteligencia artificial y big data, ha surgido como una solución. AIOps juega un papel crucial en mejorar la calidad del servicio y la satisfacción del cliente, aumentar la productividad de la ingeniería y reducir los costos operativos. Este artículo profundiza en las tareas principales involucradas en AIOps, como la detección de anomalías y el análisis y clasificación de fallos en los registros. Un desafío significativo identificado en muchas tareas de AIOps es la escasez de datos de muestra de fallos, lo que indica una alineación natural de estas tareas con el aprendizaje de pocos ejemplos. Inspirados por el meta-aprendizaje agnóstico de modelos (MAML), proponemos un nuevo detector de anomalías, MAML-KAD, para su aplicación en diversas tareas de AIOps. Las observaciones confirman que los algoritmos de meta-aprendizaje mejoran efectivamente las tareas de AIOps, mostrando las amplias perspectivas de aplicación de los algoritmos de meta-aprendizaje en el campo de AIOps. Además, presentamos una plataforma de AIOps que incorpora el meta-aprendizaje en su núcleo de diagnóstico y cuenta con una recopilación de registros simplificada, almacenamiento en caché y alertas para automatizar el flujo de trabajo de AIOps.
Descripción
Con el avance de tecnologías como 5G, la computación en la nube y los microservicios, la complejidad de los sistemas de gestión de redes y la variedad de componentes técnicos han aumentado considerablemente. Este aumento en la complejidad ha hecho que los métodos tradicionales de operaciones y mantenimiento sean insuficientes para satisfacer las demandas actuales de monitoreo y mantenimiento. En consecuencia, la inteligencia artificial para operaciones de TI (AIOps), que aprovecha las tecnologías de inteligencia artificial y big data, ha surgido como una solución. AIOps juega un papel crucial en mejorar la calidad del servicio y la satisfacción del cliente, aumentar la productividad de la ingeniería y reducir los costos operativos. Este artículo profundiza en las tareas principales involucradas en AIOps, como la detección de anomalías y el análisis y clasificación de fallos en los registros. Un desafío significativo identificado en muchas tareas de AIOps es la escasez de datos de muestra de fallos, lo que indica una alineación natural de estas tareas con el aprendizaje de pocos ejemplos. Inspirados por el meta-aprendizaje agnóstico de modelos (MAML), proponemos un nuevo detector de anomalías, MAML-KAD, para su aplicación en diversas tareas de AIOps. Las observaciones confirman que los algoritmos de meta-aprendizaje mejoran efectivamente las tareas de AIOps, mostrando las amplias perspectivas de aplicación de los algoritmos de meta-aprendizaje en el campo de AIOps. Además, presentamos una plataforma de AIOps que incorpora el meta-aprendizaje en su núcleo de diagnóstico y cuenta con una recopilación de registros simplificada, almacenamiento en caché y alertas para automatizar el flujo de trabajo de AIOps.