HiPC-QR: Encadenamiento Jerárquico de Prompts para la Reformulación de Consultas
Autores: Yang, Hua; Li, Hanyang; Gonçalves, Teresa
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
HiPC-QR: Encadenamiento Jerárquico de Prompts para la Reformulación de Consultas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Técnicas de reformulación de consultas
Sistemas de recuperación de información
Modelos de lenguaje grandes
Ingeniería de prompts
Encadenamiento jerárquico de prompts
Intención de consulta
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las técnicas de reformulación de consultas optimizan las consultas de los usuarios para alinearlas mejor con los documentos, mejorando así el rendimiento de los sistemas de Recuperación de Información (IR). Los métodos anteriores se han centrado principalmente en la expansión de consultas utilizando técnicas como el reemplazo de sinónimos para mejorar el recuerdo. Con el rápido avance de los Modelos de Lenguaje Grande (LLMs), el conocimiento incorporado en estos modelos ha crecido. La investigación en ingeniería de prompts ha introducido varios métodos, siendo la cadena de prompts particularmente efectiva para tareas complejas. Promover directamente a los LLMs para reformular consultas se ha convertido en un enfoque viable. Sin embargo, los métodos de prompts basados en LLM existentes para la reformulación de consultas a menudo introducen contenido irrelevante en las consultas reformuladas, lo que resulta en una disminución de la precisión de recuperación y desalineación con la intención del usuario. Proponemos un enfoque novedoso llamado Cadena de Prompts Jerárquica para la Reformulación de Consultas (HiPC-QR). HiPC-QR emplea una técnica de cadena de prompts en dos pasos para extraer palabras clave de la consulta original y refinar su estructura filtrando palabras clave no esenciales según la intención de consulta del usuario. Este proceso reduce la restrictividad de la consulta mientras expande simultáneamente palabras clave esenciales para mejorar la efectividad de recuperación. Evaluamos la efectividad de HiPC-QR en dos conjuntos de datos de recuperación de referencia, a saber, MS MARCO y TREC Deep Learning. Los resultados experimentales muestran que HiPC-QR supera a los métodos existentes de reformulación de consultas en conjuntos de datos a gran escala en términos de recall@10 y MRR@10.
Descripción
Las técnicas de reformulación de consultas optimizan las consultas de los usuarios para alinearlas mejor con los documentos, mejorando así el rendimiento de los sistemas de Recuperación de Información (IR). Los métodos anteriores se han centrado principalmente en la expansión de consultas utilizando técnicas como el reemplazo de sinónimos para mejorar el recuerdo. Con el rápido avance de los Modelos de Lenguaje Grande (LLMs), el conocimiento incorporado en estos modelos ha crecido. La investigación en ingeniería de prompts ha introducido varios métodos, siendo la cadena de prompts particularmente efectiva para tareas complejas. Promover directamente a los LLMs para reformular consultas se ha convertido en un enfoque viable. Sin embargo, los métodos de prompts basados en LLM existentes para la reformulación de consultas a menudo introducen contenido irrelevante en las consultas reformuladas, lo que resulta en una disminución de la precisión de recuperación y desalineación con la intención del usuario. Proponemos un enfoque novedoso llamado Cadena de Prompts Jerárquica para la Reformulación de Consultas (HiPC-QR). HiPC-QR emplea una técnica de cadena de prompts en dos pasos para extraer palabras clave de la consulta original y refinar su estructura filtrando palabras clave no esenciales según la intención de consulta del usuario. Este proceso reduce la restrictividad de la consulta mientras expande simultáneamente palabras clave esenciales para mejorar la efectividad de recuperación. Evaluamos la efectividad de HiPC-QR en dos conjuntos de datos de recuperación de referencia, a saber, MS MARCO y TREC Deep Learning. Los resultados experimentales muestran que HiPC-QR supera a los métodos existentes de reformulación de consultas en conjuntos de datos a gran escala en términos de recall@10 y MRR@10.