Extracción no supervisada de información numérica mediante la explotación de estructuras sintácticas
Autores: Wang, Zixiang; Li, Tongliang; Li, Zhoujun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Extracción no supervisada de información numérica mediante la explotación de estructuras sintácticas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Información numérica
Extracción
QuantityIE
Representaciones estructuradas
Características sintácticas
Recuperación de información
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 25
Citaciones: Sin citaciones
La información numérica juega un papel importante en diversos campos como científico, financiero, social, estadístico y de noticias. La mayoría de los estudios previos adoptan métodos no supervisados mediante el diseño de reglas complejas de coincidencia de patrones hechas a mano para extraer información numérica, lo cual puede ser difícil de escalar al dominio abierto. Otros métodos supervisados requieren tiempo adicional, costos y conocimiento para diseñar, entender y anotar los datos de entrenamiento. Para abordar estas limitaciones, proponemos QuantityIE, un enfoque novedoso para extraer información numérica como representaciones estructuradas aprovechando las características sintácticas tanto del análisis de constituyentes (CP) como del análisis de dependencias (DP). Los resultados de extracción también pueden servir como supervisión a distancia para el entrenamiento de modelos de cero disparo. Nuestro enfoque supera a los métodos existentes desde dos perspectivas: (1) las reglas son simples pero efectivas, y (2) los resultados son más autocontenidos. Además, proponemos un enfoque de recuperación de información numérica basado en QuantityIE para responder a consultas analíticas. Los resultados experimentales sobre extracción y recuperación de información demuestran la efectividad de QuantityIE en extraer información numérica con alta fidelidad.
Descripción
La información numérica juega un papel importante en diversos campos como científico, financiero, social, estadístico y de noticias. La mayoría de los estudios previos adoptan métodos no supervisados mediante el diseño de reglas complejas de coincidencia de patrones hechas a mano para extraer información numérica, lo cual puede ser difícil de escalar al dominio abierto. Otros métodos supervisados requieren tiempo adicional, costos y conocimiento para diseñar, entender y anotar los datos de entrenamiento. Para abordar estas limitaciones, proponemos QuantityIE, un enfoque novedoso para extraer información numérica como representaciones estructuradas aprovechando las características sintácticas tanto del análisis de constituyentes (CP) como del análisis de dependencias (DP). Los resultados de extracción también pueden servir como supervisión a distancia para el entrenamiento de modelos de cero disparo. Nuestro enfoque supera a los métodos existentes desde dos perspectivas: (1) las reglas son simples pero efectivas, y (2) los resultados son más autocontenidos. Además, proponemos un enfoque de recuperación de información numérica basado en QuantityIE para responder a consultas analíticas. Los resultados experimentales sobre extracción y recuperación de información demuestran la efectividad de QuantityIE en extraer información numérica con alta fidelidad.