Programación de flujo de trabajo tolerante a fallos dinámica con reejecución híbrida espacial-temporal en nubes
Autores: Wu, Na; Zuo, Decheng; Zhang, Zhan
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Programación de flujo de trabajo tolerante a fallos dinámica con reejecución híbrida espacial-temporal en nubes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Mejorando la fiabilidad
Programación de flujos de trabajo científicos
Enfoque tolerante a fallos
Flujos de trabajo a gran escala
Programación dinámica
Decisiones en tiempo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Mejorar la fiabilidad es una de las principales preocupaciones de la programación de flujos de trabajo científicos en la nube. La creciente complejidad computacional y el tamaño de los datos de los flujos de trabajo presentan desafíos para la programación de flujos de trabajo tolerantes a fallos. Por lo tanto, es esencial diseñar un enfoque de programación tolerante a fallos y rentable para flujos de trabajo a gran escala. En este artículo, proponemos un enfoque de programación de flujos de trabajo tolerante a fallos dinámico (DFTWS) con esquemas híbridos de reejecución espacial y temporal. Primero, DFTWS calcula los atributos de tiempo de las tareas e identifica el camino crítico del flujo de trabajo por adelantado. Luego, DFTWS asigna una máquina virtual (VM) apropiada para cada tarea de acuerdo con la urgencia de la tarea y el presupuesto disponible en la fase de asignación inicial de recursos. Finalmente, DFTWS realiza la programación en línea, que toma decisiones tolerantes a fallos en tiempo real basadas en el tipo de fallo y la criticidad de la tarea a lo largo de la ejecución del flujo de trabajo. El algoritmo propuesto se evalúa en flujos de trabajo del mundo real. Además, se analizan los factores que afectan el rendimiento de DFTWS. Los resultados experimentales demuestran que DFTWS logra un equilibrio entre alta fiabilidad y objetivos de bajo costo en entornos de computación en la nube.
Descripción
Mejorar la fiabilidad es una de las principales preocupaciones de la programación de flujos de trabajo científicos en la nube. La creciente complejidad computacional y el tamaño de los datos de los flujos de trabajo presentan desafíos para la programación de flujos de trabajo tolerantes a fallos. Por lo tanto, es esencial diseñar un enfoque de programación tolerante a fallos y rentable para flujos de trabajo a gran escala. En este artículo, proponemos un enfoque de programación de flujos de trabajo tolerante a fallos dinámico (DFTWS) con esquemas híbridos de reejecución espacial y temporal. Primero, DFTWS calcula los atributos de tiempo de las tareas e identifica el camino crítico del flujo de trabajo por adelantado. Luego, DFTWS asigna una máquina virtual (VM) apropiada para cada tarea de acuerdo con la urgencia de la tarea y el presupuesto disponible en la fase de asignación inicial de recursos. Finalmente, DFTWS realiza la programación en línea, que toma decisiones tolerantes a fallos en tiempo real basadas en el tipo de fallo y la criticidad de la tarea a lo largo de la ejecución del flujo de trabajo. El algoritmo propuesto se evalúa en flujos de trabajo del mundo real. Además, se analizan los factores que afectan el rendimiento de DFTWS. Los resultados experimentales demuestran que DFTWS logra un equilibrio entre alta fiabilidad y objetivos de bajo costo en entornos de computación en la nube.