logo móvil
Contáctanos

Extracción no supervisada de información numérica mediante la explotación de estructuras sintácticas

Autores: Wang, Zixiang; Li, Tongliang; Li, Zhoujun

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Extracción no supervisada de información numérica mediante la explotación de estructuras sintácticas


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Información numérica
Extracción
QuantityIE
Representaciones estructuradas
Características sintácticas
Recuperación de información

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 25

Citaciones: Sin citaciones


Descripción
La información numérica juega un papel importante en diversos campos como científico, financiero, social, estadístico y de noticias. La mayoría de los estudios previos adoptan métodos no supervisados mediante el diseño de reglas complejas de coincidencia de patrones hechas a mano para extraer información numérica, lo cual puede ser difícil de escalar al dominio abierto. Otros métodos supervisados requieren tiempo adicional, costos y conocimiento para diseñar, entender y anotar los datos de entrenamiento. Para abordar estas limitaciones, proponemos QuantityIE, un enfoque novedoso para extraer información numérica como representaciones estructuradas aprovechando las características sintácticas tanto del análisis de constituyentes (CP) como del análisis de dependencias (DP). Los resultados de extracción también pueden servir como supervisión a distancia para el entrenamiento de modelos de cero disparo. Nuestro enfoque supera a los métodos existentes desde dos perspectivas: (1) las reglas son simples pero efectivas, y (2) los resultados son más autocontenidos. Además, proponemos un enfoque de recuperación de información numérica basado en QuantityIE para responder a consultas analíticas. Los resultados experimentales sobre extracción y recuperación de información demuestran la efectividad de QuantityIE en extraer información numérica con alta fidelidad.

Otros recursos que podrían interesarte

Temas Virtualpro