Un estudio empírico de la búsqueda de regresión lineal segmentada en LevelDB
Autores: Ramadhan, Agung Rahmat; Choi, Min-guk; Chung, Yoojin; Choi, Jongmoo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un estudio empírico de la búsqueda de regresión lineal segmentada en LevelDB
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Mecanismo de búsqueda novedoso
Búsqueda SLR
índice aprendido
Correlación lineal
Técnicas de segmentación
Rendimiento de búsqueda
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
El propósito de este documento es proponer un mecanismo de búsqueda novedoso, llamado búsqueda SLR (Regresión Lineal Segmentada), basado en el concepto de índice aprendido. Está motivado por nuestra observación de que muchos datos grandes, recopilados y utilizados por estudios anteriores, tienen una propiedad, lo que significa que las claves y sus ubicaciones almacenadas muestran una fuerte correlación lineal. Esta observación nos lleva a diseñar la búsqueda SLR donde aplicamos la segmentación en el conocido algoritmo de aprendizaje automático, regresión lineal, para identificar una ubicación a partir de una clave dada. Diseñamos dos técnicas de segmentación, y, con la consideración tanto de la precisión de la predicción como de la sobrecarga de segmentación. Implementamos nuestra propuesta en LevelDB, el almacén de valores clave de Google, y verificamos que puede mejorar el rendimiento de la búsqueda hasta un 12.7%. Además, encontramos que la técnica de tamaño igual proporciona eficiencia en el entrenamiento mientras que la técnica consciente del error es tolerable a datos ruidosos.
Descripción
El propósito de este documento es proponer un mecanismo de búsqueda novedoso, llamado búsqueda SLR (Regresión Lineal Segmentada), basado en el concepto de índice aprendido. Está motivado por nuestra observación de que muchos datos grandes, recopilados y utilizados por estudios anteriores, tienen una propiedad, lo que significa que las claves y sus ubicaciones almacenadas muestran una fuerte correlación lineal. Esta observación nos lleva a diseñar la búsqueda SLR donde aplicamos la segmentación en el conocido algoritmo de aprendizaje automático, regresión lineal, para identificar una ubicación a partir de una clave dada. Diseñamos dos técnicas de segmentación, y, con la consideración tanto de la precisión de la predicción como de la sobrecarga de segmentación. Implementamos nuestra propuesta en LevelDB, el almacén de valores clave de Google, y verificamos que puede mejorar el rendimiento de la búsqueda hasta un 12.7%. Además, encontramos que la técnica de tamaño igual proporciona eficiencia en el entrenamiento mientras que la técnica consciente del error es tolerable a datos ruidosos.