logo móvil
Contáctanos

Una representación de base de datos gráfica de documentos relacionados con el crimen en Portugal

Autores: Carnaz, Gonçalo; Nogueira, Vitor Beires; Antunes, Mário

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Una representación de base de datos gráfica de documentos relacionados con el crimen en Portugal


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Organizaciones
Procesamiento de datos
Investigación criminal policial
Extracción automática
Entidades nombradas
Base de datos gráfica

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Las organizaciones se han visto desafiadas por la necesidad de procesar una cantidad creciente de datos, tanto estructurados como no estructurados, recuperados de fuentes heterogéneas. La policía de investigación criminal se encuentra entre estas organizaciones, ya que debe procesar manualmente un gran número de informes criminales, artículos de noticias relacionados con delitos, informes de ocurrencias y evidencias, y otros documentos no estructurados. La extracción automática y la representación de datos y conocimientos en tales documentos es una tarea esencial para reducir la carga de análisis manual y automatizar el descubrimiento de nombres y relaciones de entidades que pueden existir en un caso. Este documento presenta SEMCrime, un marco utilizado para extraer y clasificar entidades nombradas y relaciones en informes y documentos criminales en portugués, y representar los datos recuperados en una base de datos gráfica. Se aplicó un método de extracción de información 5WH1 (Quién, Qué, Por qué, Dónde, Cuándo y Cómo), y se utilizó una representación de base de datos gráfica para almacenar y visualizar las relaciones extraídas de los documentos. Se obtuvieron resultados prometedores con un prototipo desarrollado para evaluar el marco, a saber, un reconocimiento de entidades nombradas con una medida F de 0.73, y un rendimiento de extracción de información 5W1H con una medida F de 0.65.

Otros recursos que podrían interesarte

Temas Virtualpro