Diseño e implementación de un sistema de predicción de fallas basado en aprendizaje automático en infraestructura en la nube
Autores: Yang, Hyunsik; Kim, Younghan
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Diseño e implementación de un sistema de predicción de fallas basado en aprendizaje automático en infraestructura en la nube
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Método
Detección de fallos
Entorno de nube
Aprendizaje automático
Situaciones de fallo
Recuperación automática
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
El método para asegurar la disponibilidad en un entorno de nube existente es principalmente un método de detección de fallas basado en métricas. Sin embargo, el método de detección de fallas existente dificulta la configuración del entorno a medida que aumenta el tamaño de la nube y se vuelve más complejo, siendo necesario comprender con precisión la métrica para utilizarla de manera precisa. Además, se requieren cambios adicionales cada vez que cambia el entorno de monitoreo. Para resolver estos problemas, recientemente se han propuesto varios métodos de detección y predicción de fallas basados en aprendizaje automático. El modelo de detección y recuperación de fallas basado en aprendizaje automático más comúnmente propuesto en el entorno de nube es un método de aprendizaje supervisado que aprende datos relacionados con situaciones de falla y, basándose en estos datos, detecta fallas. Sin embargo, existe un límite para el aprendizaje de fallas porque es difícil obtener todos los datos de situaciones de falla necesarios para aprender todas las situaciones de falla que ocurren en un entorno de nube a gran escala. Además, es difícil detectar una falla cuando ocurre un patrón de falla diferente al aprendido. Además, es necesario discutir la arquitectura de recuperación automática que conduce al procedimiento de recuperación de fallas basado en los resultados de la detección de fallas. Por lo tanto, en este documento, diseñamos e implementamos un sistema completo que predice fallas detectando situaciones de falla utilizando el método de detección de anomalías.
Descripción
El método para asegurar la disponibilidad en un entorno de nube existente es principalmente un método de detección de fallas basado en métricas. Sin embargo, el método de detección de fallas existente dificulta la configuración del entorno a medida que aumenta el tamaño de la nube y se vuelve más complejo, siendo necesario comprender con precisión la métrica para utilizarla de manera precisa. Además, se requieren cambios adicionales cada vez que cambia el entorno de monitoreo. Para resolver estos problemas, recientemente se han propuesto varios métodos de detección y predicción de fallas basados en aprendizaje automático. El modelo de detección y recuperación de fallas basado en aprendizaje automático más comúnmente propuesto en el entorno de nube es un método de aprendizaje supervisado que aprende datos relacionados con situaciones de falla y, basándose en estos datos, detecta fallas. Sin embargo, existe un límite para el aprendizaje de fallas porque es difícil obtener todos los datos de situaciones de falla necesarios para aprender todas las situaciones de falla que ocurren en un entorno de nube a gran escala. Además, es difícil detectar una falla cuando ocurre un patrón de falla diferente al aprendido. Además, es necesario discutir la arquitectura de recuperación automática que conduce al procedimiento de recuperación de fallas basado en los resultados de la detección de fallas. Por lo tanto, en este documento, diseñamos e implementamos un sistema completo que predice fallas detectando situaciones de falla utilizando el método de detección de anomalías.