logo móvil
Contáctanos

Revisitar la indexación de bases de datos para la computación paralela y acelerada: un estudio exhaustivo y enfoques novedosos

Autores: Abbasi, Maryam; Bernardo, Marco V.; Váz, Paulo; Silva, José; Martins, Pedro

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Revisitar la indexación de bases de datos para la computación paralela y acelerada: un estudio exhaustivo y enfoques novedosos


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Estrategias de indexación
Arquitecturas de hardware
Procesamiento paralelo
Enfoques de indexación tradicionales
Indexación consciente del hardware
Implicaciones de rendimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Si bien la importancia de las estrategias de indexación para optimizar el rendimiento de las consultas en sistemas de bases de datos es ampliamente reconocida, el impacto de las arquitecturas de hardware en rápida evolución sobre las técnicas de indexación ha sido un área poco explorada. A medida que los sistemas informáticos modernos aprovechan cada vez más las capacidades de procesamiento paralelo, las CPU de múltiples núcleos y los aceleradores de hardware especializados, los enfoques de indexación tradicionales pueden no capitalizar completamente estos avances. Este estudio experimental integral investiga los efectos de las estrategias de indexación conscientes del hardware adaptadas a plataformas de hardware contemporáneas y emergentes. A través de una rigurosa experimentación en un entorno de base de datos del mundo real utilizando el estándar de la industria TPC-H, esta investigación evalúa las implicaciones de rendimiento de las técnicas de indexación diseñadas específicamente para explotar el paralelismo, la vectorización y las operaciones aceleradas por hardware. Al examinar enfoques como las variantes de B-Tree conscientes de la caché, los índices hash optimizados para SIMD y la indexación espacial acelerada por GPU, el estudio proporciona valiosos conocimientos sobre las posibles ganancias de rendimiento y los compromisos asociados con estos métodos de indexación conscientes del hardware. Los hallazgos revelan que las estrategias de indexación conscientes del hardware pueden superar significativamente a sus contrapartes tradicionales, particularmente en cargas de trabajo intensivas en datos y despliegues de bases de datos a gran escala. Nuestros experimentos muestran mejoras que oscilan entre el 32.4% y el 48.6% en el tiempo de ejecución de consultas, dependiendo de la técnica específica y la configuración del hardware. Sin embargo, el estudio también destaca la complejidad de implementar y ajustar estas técnicas, ya que a menudo requieren optimizaciones de código intrincadas y una profunda comprensión de la arquitectura de hardware subyacente. Además, esta investigación explora el potencial de los enfoques de indexación basados en aprendizaje automático, incluyendo el aprendizaje por refuerzo para la selección de índices y asesores de índices basados en redes neuronales. Si bien estas técnicas muestran promesas, con mejoras de rendimiento de hasta el 48.6% en ciertos escenarios, su efectividad varía según los diferentes tipos de consultas y distribuciones de datos. Al ofrecer un análisis integral y recomendaciones prácticas, esta investigación contribuye a la búsqueda continua de la optimización del rendimiento de bases de datos en la era de la computación heterogénea. Los hallazgos informan a los administradores de bases de datos, desarrolladores y arquitectos de sistemas sobre prácticas de indexación efectivas adaptadas al hardware moderno, al tiempo que allanan el camino para futuras investigaciones sobre técnicas de indexación adaptativas que puedan aprovechar dinámicamente las capacidades del hardware según las características de la carga de trabajo y la disponibilidad de recursos.

Otros recursos que podrían interesarte

Temas Virtualpro