Eficiente optimización de consultas impulsada por IA en bases de datos a gran escala: un enfoque de aprendizaje por refuerzo y basado en gráficos
Autores: Sassi, Najla; Jaziri, Wassim
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Eficiente optimización de consultas impulsada por IA en bases de datos a gran escala: un enfoque de aprendizaje por refuerzo y basado en gráficos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aplicaciones centradas en datos
Optimización de consultas
Bases de datos relacionales a gran escala
Aprendizaje por refuerzo
Optimizador de consultas híbrido basado en grafos
Selección de orden de unión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
A medida que las aplicaciones centradas en datos se vuelven cada vez más complejas, comprender la optimización efectiva de consultas en bases de datos relacionales a gran escala es crucial para gestionar esta complejidad. Sin embargo, los enfoques tradicionales basados en costos y heurísticos simplemente no escalan, se adaptan o permanecen precisos en consultas altamente dinámicas de múltiples joins. Este trabajo de investigación propone el optimizador de consultas híbrido basado en aprendizaje por refuerzo y gráficos (GRQO), el primero en aplicar aprendizaje por refuerzo y teoría de gráficos para optimizar planes de ejecución de consultas, específicamente en la selección de órdenes de joins y estimación de cardinalidad. Al emplear la optimización de políticas proximales para el aprendizaje de políticas adaptativas y utilizar representaciones de esquemas basadas en gráficos para modelado relacional, GRQO atraviesa efectivamente el espacio de optimización combinatoria. Basado en cargas de trabajo de TPC-H (1 TB) e IMDB (500 GB), GRQO se ejecuta un 25% más rápido en tiempo de ejecución de consultas, escala un 30% mejor, reduce el uso de CPU y memoria en un 20-25%, y reduce el error de estimación de cardinalidad en un 47% en comparación con optimizadores tradicionales basados en costos y optimizadores basados en aprendizaje automático. Estos hallazgos destacan la capacidad de GRQO para optimizar el rendimiento y la eficiencia de recursos en la gestión de bases de datos en la computación en la nube, el almacenamiento de datos y la analítica en tiempo real.
Descripción
A medida que las aplicaciones centradas en datos se vuelven cada vez más complejas, comprender la optimización efectiva de consultas en bases de datos relacionales a gran escala es crucial para gestionar esta complejidad. Sin embargo, los enfoques tradicionales basados en costos y heurísticos simplemente no escalan, se adaptan o permanecen precisos en consultas altamente dinámicas de múltiples joins. Este trabajo de investigación propone el optimizador de consultas híbrido basado en aprendizaje por refuerzo y gráficos (GRQO), el primero en aplicar aprendizaje por refuerzo y teoría de gráficos para optimizar planes de ejecución de consultas, específicamente en la selección de órdenes de joins y estimación de cardinalidad. Al emplear la optimización de políticas proximales para el aprendizaje de políticas adaptativas y utilizar representaciones de esquemas basadas en gráficos para modelado relacional, GRQO atraviesa efectivamente el espacio de optimización combinatoria. Basado en cargas de trabajo de TPC-H (1 TB) e IMDB (500 GB), GRQO se ejecuta un 25% más rápido en tiempo de ejecución de consultas, escala un 30% mejor, reduce el uso de CPU y memoria en un 20-25%, y reduce el error de estimación de cardinalidad en un 47% en comparación con optimizadores tradicionales basados en costos y optimizadores basados en aprendizaje automático. Estos hallazgos destacan la capacidad de GRQO para optimizar el rendimiento y la eficiencia de recursos en la gestión de bases de datos en la computación en la nube, el almacenamiento de datos y la analítica en tiempo real.