Dos formas de búsqueda lineal reexaminadas
Autores: Dalal, Ketan; Devroye, Luc; Malalla, Ebrahim
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Dos formas de búsqueda lineal reexaminadas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Sondeo lineal
Algoritmos de hashing
Rendimiento
Tamaño del clúster
Sondeo lineal bidireccional
Factor de carga
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
La exploración lineal sigue siendo uno de los mejores algoritmos de dispersión prácticos debido a su buen rendimiento promedio, eficiencia y simplicidad de implementación. Sin embargo, el rendimiento en el peor de los casos de la exploración lineal parece degradarse con altos factores de carga debido a una tendencia de agrupamiento primario donde una colisión causa más colisiones cercanas. Se sabe que el tamaño máximo de un clúster producido por la exploración lineal, y por lo tanto la longitud de la secuencia de sonda más larga necesaria para insertar o buscar una clave en una tabla hash de tamaño , es , en probabilidad. En este artículo, presentamos esquemas de dispersión por exploración lineal que emplean dos secuencias de sonda lineal para encontrar celdas vacías para las claves. Nuestros resultados muestran que la exploración lineal bidireccional es una alternativa prometedora a la exploración lineal para tablas hash. Mostramos que la exploración lineal bidireccional tiene un tamaño máximo de clúster casi seguro asintóticamente cuando el factor de carga es constante. También se obtienen cotas inferiores coincidentes en el tamaño máximo de clúster producido por cualquier algoritmo de exploración lineal bidireccional. Nuestro análisis se basa en un enfoque novedoso que utiliza el paradigma de elección múltiple y árboles testigos.
Descripción
La exploración lineal sigue siendo uno de los mejores algoritmos de dispersión prácticos debido a su buen rendimiento promedio, eficiencia y simplicidad de implementación. Sin embargo, el rendimiento en el peor de los casos de la exploración lineal parece degradarse con altos factores de carga debido a una tendencia de agrupamiento primario donde una colisión causa más colisiones cercanas. Se sabe que el tamaño máximo de un clúster producido por la exploración lineal, y por lo tanto la longitud de la secuencia de sonda más larga necesaria para insertar o buscar una clave en una tabla hash de tamaño , es , en probabilidad. En este artículo, presentamos esquemas de dispersión por exploración lineal que emplean dos secuencias de sonda lineal para encontrar celdas vacías para las claves. Nuestros resultados muestran que la exploración lineal bidireccional es una alternativa prometedora a la exploración lineal para tablas hash. Mostramos que la exploración lineal bidireccional tiene un tamaño máximo de clúster casi seguro asintóticamente cuando el factor de carga es constante. También se obtienen cotas inferiores coincidentes en el tamaño máximo de clúster producido por cualquier algoritmo de exploración lineal bidireccional. Nuestro análisis se basa en un enfoque novedoso que utiliza el paradigma de elección múltiple y árboles testigos.