Dominio-específico Pregunta-Respuesta de Tabla de Pocos Disparos a través de la Selección de Ejemplos Contrastivos
Autores: Mo, Tianjin; Xiao, Qiao; Zhang, Hongyi; Li, Ren; Wu, Yunsong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Dominio-específico Pregunta-Respuesta de Tabla de Pocos Disparos a través de la Selección de Ejemplos Contrastivos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Procesamiento de lenguaje natural
Respuesta a preguntas de tablas
Declaraciones SQL
Modelos de lenguaje grandes
Respuesta a preguntas de tablas con pocas muestras
Plantillas de instrucciones
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 43
Citaciones: Sin citaciones
Como tarea crucial en el procesamiento del lenguaje natural, la respuesta a preguntas de tablas ha recibido una atención significativa tanto de la comunidad académica como industrial. Permite realizar consultas inteligentes y responder preguntas sobre datos estructurados mediante la traducción del lenguaje natural a declaraciones SQL correspondientes. Recientemente, ha habido avances notables en la tarea de respuesta a preguntas de tablas en el dominio general, logrados a través del aprendizaje de indicaciones con modelos de lenguaje grandes. Sin embargo, en dominios específicos, donde las tablas suelen tener un mayor número de columnas y las preguntas tienden a ser más complejas, los modelos de lenguaje grandes tienden a generar declaraciones SQL o NoSQL inválidas. Para abordar el problema anterior, este documento propone un enfoque novedoso de respuesta a preguntas de tablas de pocos disparos. Específicamente, diseñamos una estrategia de construcción de plantillas de indicación para la generación estructurada de SQL. Utiliza plantillas de indicación para reestructurar la entrada para cada dato de prueba y estandariza la salida del modelo, lo que puede mejorar la integridad y validez del SQL generado. Además, este documento introduce un enfoque de selección de ejemplos contrastivos basado en los patrones y formatos de preguntas en contextos específicos del dominio. Esto permite que el modelo recupere rápidamente los ejemplos relevantes y aprenda características sobre la pregunta dada. Los resultados experimentales en los dos conjuntos de datos en los dominios de energía eléctrica e inspección estructural muestran que el enfoque propuesto supera a los modelos de referencia en todas las configuraciones de comparación.
Descripción
Como tarea crucial en el procesamiento del lenguaje natural, la respuesta a preguntas de tablas ha recibido una atención significativa tanto de la comunidad académica como industrial. Permite realizar consultas inteligentes y responder preguntas sobre datos estructurados mediante la traducción del lenguaje natural a declaraciones SQL correspondientes. Recientemente, ha habido avances notables en la tarea de respuesta a preguntas de tablas en el dominio general, logrados a través del aprendizaje de indicaciones con modelos de lenguaje grandes. Sin embargo, en dominios específicos, donde las tablas suelen tener un mayor número de columnas y las preguntas tienden a ser más complejas, los modelos de lenguaje grandes tienden a generar declaraciones SQL o NoSQL inválidas. Para abordar el problema anterior, este documento propone un enfoque novedoso de respuesta a preguntas de tablas de pocos disparos. Específicamente, diseñamos una estrategia de construcción de plantillas de indicación para la generación estructurada de SQL. Utiliza plantillas de indicación para reestructurar la entrada para cada dato de prueba y estandariza la salida del modelo, lo que puede mejorar la integridad y validez del SQL generado. Además, este documento introduce un enfoque de selección de ejemplos contrastivos basado en los patrones y formatos de preguntas en contextos específicos del dominio. Esto permite que el modelo recupere rápidamente los ejemplos relevantes y aprenda características sobre la pregunta dada. Los resultados experimentales en los dos conjuntos de datos en los dominios de energía eléctrica e inspección estructural muestran que el enfoque propuesto supera a los modelos de referencia en todas las configuraciones de comparación.