Un Filtro de Aprendizaje Automático para la Tarea de Relleno de Slots
Autores: Lange Di Cesare, Kevin; Zouaq, Amal; Gagnon, Michel; Jean-Louis, Ludovic
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Un Filtro de Aprendizaje Automático para la Tarea de Relleno de Slots
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Relleno de espacios
Extracción de relaciones
Bases de conocimiento estructuradas
Filtro de aprendizaje automático
Precisión
Recuperación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El llenado de ranuras, una subtarea de la extracción de relaciones, representa un aspecto clave para construir bases de conocimiento estructuradas utilizables para la recuperación de información basada en semántica. En este trabajo, presentamos un filtro de aprendizaje automático cuyo objetivo es mejorar la precisión de los extractores de relaciones mientras se minimiza el impacto en la recuperación. Nuestro enfoque consiste en filtrar la salida de los extractores de relaciones utilizando un clasificador binario. Este clasificador se basa en una amplia variedad de características, incluidas características sintácticas, semánticas y estadísticas, como los patrones de partes del habla más frecuentes o las dependencias sintácticas entre entidades. Experimentamos con el clasificador en los 18 sistemas participantes en la pista de llenado de ranuras en inglés del TAC KBP 2013. La pista de llenado de ranuras en inglés del TAC KBP es una campaña de evaluación que tiene como objetivo la extracción de 41 relaciones preidentificadas (por ejemplo, título, fecha de nacimiento, países de residencia, etc.) relacionadas con entidades nombradas específicas (personas y organizaciones). Nuestros resultados muestran que el clasificador es capaz de mejorar la precisión global del mejor sistema de 2013 en un 20.5% y mejorar la puntuación F1 para 20 relaciones de las 33 consideradas.
Descripción
El llenado de ranuras, una subtarea de la extracción de relaciones, representa un aspecto clave para construir bases de conocimiento estructuradas utilizables para la recuperación de información basada en semántica. En este trabajo, presentamos un filtro de aprendizaje automático cuyo objetivo es mejorar la precisión de los extractores de relaciones mientras se minimiza el impacto en la recuperación. Nuestro enfoque consiste en filtrar la salida de los extractores de relaciones utilizando un clasificador binario. Este clasificador se basa en una amplia variedad de características, incluidas características sintácticas, semánticas y estadísticas, como los patrones de partes del habla más frecuentes o las dependencias sintácticas entre entidades. Experimentamos con el clasificador en los 18 sistemas participantes en la pista de llenado de ranuras en inglés del TAC KBP 2013. La pista de llenado de ranuras en inglés del TAC KBP es una campaña de evaluación que tiene como objetivo la extracción de 41 relaciones preidentificadas (por ejemplo, título, fecha de nacimiento, países de residencia, etc.) relacionadas con entidades nombradas específicas (personas y organizaciones). Nuestros resultados muestran que el clasificador es capaz de mejorar la precisión global del mejor sistema de 2013 en un 20.5% y mejorar la puntuación F1 para 20 relaciones de las 33 consideradas.