Un eficaz agrupamiento difuso de informes de delitos integrado por un modelo de codificador de oraciones universal
Autores: Pramanik, Aparna; Das, Asit Kumar; Pelusi, Danilo; Nayak, Janmenjoy
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un eficaz agrupamiento difuso de informes de delitos integrado por un modelo de codificador de oraciones universal
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Informes de crimen
Agrupamiento
Frases relacionadas con el crimen
Transformador
Modelo de codificador universal
Algoritmo de agrupamiento basado en grafos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La agrupación de informes de delitos es crucial para identificar y prevenir actividades criminales que ocurren con frecuencia en la sociedad. En el trabajo propuesto, se reconocen entidades nombradas en un informe para extraer frases relacionadas con el crimen y posteriormente, las frases se procesan aplicando la eliminación de palabras vacías y operaciones de lematización. A continuación, se aplica el módulo del modelo de codificador universal, llamado el transformador, para extraer frases del informe y obtener una incrustación de oración para cada oración asociada, cuya agregación proporciona finalmente la representación vectorial de ese informe. Se ha propuesto un algoritmo de agrupamiento basado en grafos innovador y eficiente que consiste en operaciones de división y fusión para obtener el grupo de informes de delitos. El algoritmo de agrupamiento propuesto genera grupos superpuestos, lo que indica la existencia de informes de múltiples tipos de delitos. La teoría difusa se ha utilizado para proporcionar una puntuación al informe que exprese su pertenencia a diferentes grupos, y en consecuencia, los informes son etiquetados por múltiples categorías. La eficacia del método propuesto se ha evaluado teniendo en cuenta diferentes conjuntos de datos y comparándolos con otros enfoques de vanguardia con la ayuda de varias métricas de rendimiento.
Descripción
La agrupación de informes de delitos es crucial para identificar y prevenir actividades criminales que ocurren con frecuencia en la sociedad. En el trabajo propuesto, se reconocen entidades nombradas en un informe para extraer frases relacionadas con el crimen y posteriormente, las frases se procesan aplicando la eliminación de palabras vacías y operaciones de lematización. A continuación, se aplica el módulo del modelo de codificador universal, llamado el transformador, para extraer frases del informe y obtener una incrustación de oración para cada oración asociada, cuya agregación proporciona finalmente la representación vectorial de ese informe. Se ha propuesto un algoritmo de agrupamiento basado en grafos innovador y eficiente que consiste en operaciones de división y fusión para obtener el grupo de informes de delitos. El algoritmo de agrupamiento propuesto genera grupos superpuestos, lo que indica la existencia de informes de múltiples tipos de delitos. La teoría difusa se ha utilizado para proporcionar una puntuación al informe que exprese su pertenencia a diferentes grupos, y en consecuencia, los informes son etiquetados por múltiples categorías. La eficacia del método propuesto se ha evaluado teniendo en cuenta diferentes conjuntos de datos y comparándolos con otros enfoques de vanguardia con la ayuda de varias métricas de rendimiento.