Una representación de base de datos gráfica de documentos relacionados con el crimen en Portugal
Autores: Carnaz, Gonçalo; Nogueira, Vitor Beires; Antunes, Mário
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Una representación de base de datos gráfica de documentos relacionados con el crimen en Portugal
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Organizaciones
Procesamiento de datos
Investigación criminal policial
Extracción automática
Entidades nombradas
Base de datos gráfica
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las organizaciones se han visto desafiadas por la necesidad de procesar una cantidad creciente de datos, tanto estructurados como no estructurados, recuperados de fuentes heterogéneas. La policía de investigación criminal se encuentra entre estas organizaciones, ya que debe procesar manualmente un gran número de informes criminales, artículos de noticias relacionados con delitos, informes de ocurrencias y evidencias, y otros documentos no estructurados. La extracción automática y la representación de datos y conocimientos en tales documentos es una tarea esencial para reducir la carga de análisis manual y automatizar el descubrimiento de nombres y relaciones de entidades que pueden existir en un caso. Este documento presenta SEMCrime, un marco utilizado para extraer y clasificar entidades nombradas y relaciones en informes y documentos criminales en portugués, y representar los datos recuperados en una base de datos gráfica. Se aplicó un método de extracción de información 5WH1 (Quién, Qué, Por qué, Dónde, Cuándo y Cómo), y se utilizó una representación de base de datos gráfica para almacenar y visualizar las relaciones extraídas de los documentos. Se obtuvieron resultados prometedores con un prototipo desarrollado para evaluar el marco, a saber, un reconocimiento de entidades nombradas con una medida F de 0.73, y un rendimiento de extracción de información 5W1H con una medida F de 0.65.
Descripción
Las organizaciones se han visto desafiadas por la necesidad de procesar una cantidad creciente de datos, tanto estructurados como no estructurados, recuperados de fuentes heterogéneas. La policía de investigación criminal se encuentra entre estas organizaciones, ya que debe procesar manualmente un gran número de informes criminales, artículos de noticias relacionados con delitos, informes de ocurrencias y evidencias, y otros documentos no estructurados. La extracción automática y la representación de datos y conocimientos en tales documentos es una tarea esencial para reducir la carga de análisis manual y automatizar el descubrimiento de nombres y relaciones de entidades que pueden existir en un caso. Este documento presenta SEMCrime, un marco utilizado para extraer y clasificar entidades nombradas y relaciones en informes y documentos criminales en portugués, y representar los datos recuperados en una base de datos gráfica. Se aplicó un método de extracción de información 5WH1 (Quién, Qué, Por qué, Dónde, Cuándo y Cómo), y se utilizó una representación de base de datos gráfica para almacenar y visualizar las relaciones extraídas de los documentos. Se obtuvieron resultados prometedores con un prototipo desarrollado para evaluar el marco, a saber, un reconocimiento de entidades nombradas con una medida F de 0.73, y un rendimiento de extracción de información 5W1H con una medida F de 0.65.