La agrupación ponderada de características bi-particionada para detectar patrones de reclamos fraudulentos de seguros
Autores: Combert, Francis Kwaku; Xie, Shengkun; Lawniczak, Anna T.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
La agrupación ponderada de características bi-particionada para detectar patrones de reclamos fraudulentos de seguros
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Medias ponderadas
Algoritmo de agrupamiento
Estrategia de partición en dos
Conjuntos de datos de alta dimensión
Detección de fraude en reclamaciones de seguros
Precisión del agrupamiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
El algoritmo de agrupamiento de medias ponderadas es ampliamente reconocido por su capacidad para asignar importancia variable a las características en tareas de agrupamiento. Este documento presenta una versión mejorada del algoritmo, que incorpora una estrategia de partición en dos para segregar conjuntos de características, mejorando así su adaptabilidad a conjuntos de datos de alta dimensionalidad y heterogéneos. El enfoque de agrupamiento de medias ponderadas con bipartición propuesto (BPW -means) está diseñado para abordar desafíos en la identificación de patrones dentro de conjuntos de datos con subespacios de características distintos, como los de la detección de fraudes en reclamaciones de seguros. Las evaluaciones experimentales en conjuntos de datos de seguros del mundo real resaltan mejoras significativas tanto en la precisión del agrupamiento como en la interpretabilidad en comparación con el algoritmo clásico de medias, logrando una precisión de aproximadamente 91%, lo que representa una mejora de alrededor del 38% sobre el algoritmo clásico de medias. Además, la capacidad del método para descubrir grupos significativos relacionados con el fraude subraya su potencial como una herramienta robusta para la detección de fraudes. Más allá del ámbito de los seguros, el marco propuesto se aplica a diversos dominios donde la heterogeneidad de datos exige soluciones de agrupamiento refinadas. La aplicación del método BPW K-means a múltiples conjuntos de datos del mundo real destaca su clara superioridad sobre el algoritmo clásico K-means.
Descripción
El algoritmo de agrupamiento de medias ponderadas es ampliamente reconocido por su capacidad para asignar importancia variable a las características en tareas de agrupamiento. Este documento presenta una versión mejorada del algoritmo, que incorpora una estrategia de partición en dos para segregar conjuntos de características, mejorando así su adaptabilidad a conjuntos de datos de alta dimensionalidad y heterogéneos. El enfoque de agrupamiento de medias ponderadas con bipartición propuesto (BPW -means) está diseñado para abordar desafíos en la identificación de patrones dentro de conjuntos de datos con subespacios de características distintos, como los de la detección de fraudes en reclamaciones de seguros. Las evaluaciones experimentales en conjuntos de datos de seguros del mundo real resaltan mejoras significativas tanto en la precisión del agrupamiento como en la interpretabilidad en comparación con el algoritmo clásico de medias, logrando una precisión de aproximadamente 91%, lo que representa una mejora de alrededor del 38% sobre el algoritmo clásico de medias. Además, la capacidad del método para descubrir grupos significativos relacionados con el fraude subraya su potencial como una herramienta robusta para la detección de fraudes. Más allá del ámbito de los seguros, el marco propuesto se aplica a diversos dominios donde la heterogeneidad de datos exige soluciones de agrupamiento refinadas. La aplicación del método BPW K-means a múltiples conjuntos de datos del mundo real destaca su clara superioridad sobre el algoritmo clásico K-means.