TFR-LRC: Códigos Localmente Reparables Optimizados para Rack: Equilibrando la Tolerancia a Fallos, el Grado de Reparación y la Conciencia de Topología en Sistemas de Almacenamiento Distribuido
Autores: Wang, Yan; Cao, Yanghuang; Shi, Junhao
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
TFR-LRC: Códigos Localmente Reparables Optimizados para Rack: Equilibrando la Tolerancia a Fallos, el Grado de Reparación y la Conciencia de Topología en Sistemas de Almacenamiento Distribuido
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Grado de reparación
Tolerancia a fallos
TFR-LRCs
Codificación de borrado
Sistemas de almacenamiento
Fallos de nodos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los Códigos Localmente Reparables (LRCs) se han convertido en el diseño dominante en sistemas de almacenamiento de codificación de borrado de ancho amplio debido a su excelente localización y bajo ancho de banda de reparación. En tales sistemas, el grado de reparación-definido como el número de nodos auxiliares contactados durante la recuperación de datos-es una métrica clave de rendimiento. Sin embargo, a medida que aumenta el ancho de la franja, la probabilidad de múltiples fallos simultáneos de nodos crece, lo que eleva significativamente el grado de reparación en los LRCs tradicionales. Para abordar este desafío, proponemos una nueva familia de códigos llamada TFR-LRCs (Códigos Localmente Reparables para equilibrar la tolerancia a fallos y la eficiencia de reparación). Los TFR-LRCs introducen opciones de diseño flexibles que permiten compensaciones entre la tolerancia a fallos y el grado de reparación: pueden reducir el grado de reparación aumentando ligeramente el costo de almacenamiento, o mejorar la tolerancia a fallos tolerando un grado de reparación ligeramente más alto. Diseñamos una construcción basada en matrices para generar TFR-LRCs y evaluamos su rendimiento a través de simulaciones extensas. Los resultados muestran que, bajo múltiples escenarios de fallo, TFR-LRC reduce el grado de reparación en hasta un 35% en comparación con los LRCs convencionales, mientras preserva la estructura original de LRC. Además, bajo parámetros de código idénticos, TFR-LRC logra una mejor tolerancia a fallos, tolerando hasta g+2 fallos frente a g+1 en los LRCs convencionales, con un costo adicional mínimo. Notablemente, en modo de mantenimiento, donde estantes enteros pueden volverse temporalmente no disponibles, TFR-LRC demuestra una eficiencia de recuperación sustancialmente mejor en comparación con los esquemas LRC existentes, lo que lo convierte en una opción práctica para implementaciones en el mundo real.
Descripción
Los Códigos Localmente Reparables (LRCs) se han convertido en el diseño dominante en sistemas de almacenamiento de codificación de borrado de ancho amplio debido a su excelente localización y bajo ancho de banda de reparación. En tales sistemas, el grado de reparación-definido como el número de nodos auxiliares contactados durante la recuperación de datos-es una métrica clave de rendimiento. Sin embargo, a medida que aumenta el ancho de la franja, la probabilidad de múltiples fallos simultáneos de nodos crece, lo que eleva significativamente el grado de reparación en los LRCs tradicionales. Para abordar este desafío, proponemos una nueva familia de códigos llamada TFR-LRCs (Códigos Localmente Reparables para equilibrar la tolerancia a fallos y la eficiencia de reparación). Los TFR-LRCs introducen opciones de diseño flexibles que permiten compensaciones entre la tolerancia a fallos y el grado de reparación: pueden reducir el grado de reparación aumentando ligeramente el costo de almacenamiento, o mejorar la tolerancia a fallos tolerando un grado de reparación ligeramente más alto. Diseñamos una construcción basada en matrices para generar TFR-LRCs y evaluamos su rendimiento a través de simulaciones extensas. Los resultados muestran que, bajo múltiples escenarios de fallo, TFR-LRC reduce el grado de reparación en hasta un 35% en comparación con los LRCs convencionales, mientras preserva la estructura original de LRC. Además, bajo parámetros de código idénticos, TFR-LRC logra una mejor tolerancia a fallos, tolerando hasta g+2 fallos frente a g+1 en los LRCs convencionales, con un costo adicional mínimo. Notablemente, en modo de mantenimiento, donde estantes enteros pueden volverse temporalmente no disponibles, TFR-LRC demuestra una eficiencia de recuperación sustancialmente mejor en comparación con los esquemas LRC existentes, lo que lo convierte en una opción práctica para implementaciones en el mundo real.