Optimal query expansion basada en optimización híbrida de media de grupo mejorada por optimización de chimpance utilizando aprendizaje profundo iterativo
Autores: Kumar, Ram; Tripathi, Kuldeep Narayan; Sharma, Subhash Chander
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Optimal query expansion basada en optimización híbrida de media de grupo mejorada por optimización de chimpance utilizando aprendizaje profundo iterativo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Procesamiento de lenguaje natural
Técnicas de computación suave
Expansión de consultas
Aprendizaje automático
Aprendizaje profundo
Incrustaciones de palabras
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
El internet está rodeado de información incierta que requiere el uso de técnicas de procesamiento de lenguaje natural y computación suave para extraer los documentos relevantes. Los resultados relevantes se recuperan utilizando la técnica de expansión de consultas, que se formula principalmente utilizando conceptos de aprendizaje automático o aprendizaje profundo en la literatura existente. Este documento presenta un algoritmo híbrido optimizado basado en la media de grupo mejorada (GMBO-ECO) para la expansión de consultas basada en pseudorelevancia, donde las consultas reales se expanden con sus palabras clave relacionadas. El algoritmo híbrido GMBO-ECO expande principalmente la consulta en función de los términos que tienen una fuerte interrelación con la consulta real. Para generar los embeddings de palabras, se utiliza un paradigma Word2Vec que aprende la asociación de palabras a partir de grandes corpora de texto. El contexto útil en el texto se identifica utilizando el marco de aprendizaje profundo iterativo mejorado que determina la intención del usuario para la búsqueda web actual. Este paso reduce la falta de coincidencia de las palabras y mejora el rendimiento de la recuperación de consultas. Los términos débiles son eliminados y los términos de consulta candidatos para la expansión óptima de consultas se mejoran mediante una medida Okapi y técnicas de similitud de coseno. La metodología propuesta se ha comparado con los métodos de vanguardia con y sin un enfoque de expansión de consultas. Además, la técnica de expansión de consultas óptima propuesta ha mostrado una mejora sustancial en términos de una ganancia acumulada descontada normalizada de 0.87, una precisión promedio de 0.35 y una clasificación recíproca promedio de 0.95. Los resultados experimentales muestran la eficiencia de la metodología propuesta en la recuperación de la respuesta adecuada para la recuperación de información. Las aplicaciones más comunes para el método propuesto son los motores de búsqueda.
Descripción
El internet está rodeado de información incierta que requiere el uso de técnicas de procesamiento de lenguaje natural y computación suave para extraer los documentos relevantes. Los resultados relevantes se recuperan utilizando la técnica de expansión de consultas, que se formula principalmente utilizando conceptos de aprendizaje automático o aprendizaje profundo en la literatura existente. Este documento presenta un algoritmo híbrido optimizado basado en la media de grupo mejorada (GMBO-ECO) para la expansión de consultas basada en pseudorelevancia, donde las consultas reales se expanden con sus palabras clave relacionadas. El algoritmo híbrido GMBO-ECO expande principalmente la consulta en función de los términos que tienen una fuerte interrelación con la consulta real. Para generar los embeddings de palabras, se utiliza un paradigma Word2Vec que aprende la asociación de palabras a partir de grandes corpora de texto. El contexto útil en el texto se identifica utilizando el marco de aprendizaje profundo iterativo mejorado que determina la intención del usuario para la búsqueda web actual. Este paso reduce la falta de coincidencia de las palabras y mejora el rendimiento de la recuperación de consultas. Los términos débiles son eliminados y los términos de consulta candidatos para la expansión óptima de consultas se mejoran mediante una medida Okapi y técnicas de similitud de coseno. La metodología propuesta se ha comparado con los métodos de vanguardia con y sin un enfoque de expansión de consultas. Además, la técnica de expansión de consultas óptima propuesta ha mostrado una mejora sustancial en términos de una ganancia acumulada descontada normalizada de 0.87, una precisión promedio de 0.35 y una clasificación recíproca promedio de 0.95. Los resultados experimentales muestran la eficiencia de la metodología propuesta en la recuperación de la respuesta adecuada para la recuperación de información. Las aplicaciones más comunes para el método propuesto son los motores de búsqueda.