WCGAN-GA-RF: Detección de Fraude en Salud a través de Redes Generativas Antagónicas y Selección Evolutiva de Características
Autores: Cai, Junze; Wu, Shuhui; Zhang, Yawen; Shao, Jiale; Tao, Yuanhong
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
WCGAN-GA-RF: Detección de Fraude en Salud a través de Redes Generativas Antagónicas y Selección Evolutiva de Características
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Fraude en la atención médica
Marco de detección
WCGAN-GA-RF
Reclamaciones fraudulentas
Selección de características
Bosque Aleatorio
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El fraude en la atención médica plantea riesgos significativos para los sistemas de seguros, socavando tanto la sostenibilidad financiera como el acceso equitativo a la atención. La detección precisa de reclamaciones fraudulentas es, por lo tanto, crítica para garantizar la integridad de las operaciones de seguros de salud. Sin embargo, la creciente sofisticación de las técnicas de fraude y la disponibilidad limitada de datos han socavado el rendimiento de los enfoques de detección tradicionales. Para abordar estos desafíos, este documento propone WCGAN-GA-RF, un marco integrado de detección de fraude que combina sinérgicamente la Red Generativa Antagónica Condicional de Wasserstein con penalización de gradiente (WCGAN-GP) para la generación de datos sintéticos, la selección de características basada en algoritmos genéticos (GA-RF) para la reducción de dimensionalidad y el Bosque Aleatorio (RF) para la clasificación. El marco propuesto fue validado empíricamente en un conjunto de datos del mundo real de 16,000 reclamaciones de seguros de salud de una empresa de tecnología de salud china, caracterizado por una relación de desequilibrio de clases de 16:1 (5.9% de muestras fraudulentas) y 118 características originales. Utilizando una división estratificada de 80/20 para entrenamiento y prueba con resultados promediados en cinco ejecuciones independientes, el marco WCGAN-GA-RF logró una precisión del 96.47+/-0.5%, un recall del 97.05+/-0.4% y un F1-score del 96.26+/-0.4%. Notablemente, el componente GA-RF logró una reducción del 65% en las características (de 80 a 28 características) mientras mantenía una precisión de detección competitiva. Experimentos comparativos demuestran que el enfoque propuesto supera a los métodos convencionales de sobremuestreo, incluyendo el Sobremuestreo Aleatorio (ROS), la Técnica de Sobremuestreo de Minorías Sintéticas (SMOTE) y el Muestreo Sintético Adaptativo (ADASYN), particularmente en el manejo de datos de fraude en atención médica de alta dimensión y severamente desbalanceados.
Descripción
El fraude en la atención médica plantea riesgos significativos para los sistemas de seguros, socavando tanto la sostenibilidad financiera como el acceso equitativo a la atención. La detección precisa de reclamaciones fraudulentas es, por lo tanto, crítica para garantizar la integridad de las operaciones de seguros de salud. Sin embargo, la creciente sofisticación de las técnicas de fraude y la disponibilidad limitada de datos han socavado el rendimiento de los enfoques de detección tradicionales. Para abordar estos desafíos, este documento propone WCGAN-GA-RF, un marco integrado de detección de fraude que combina sinérgicamente la Red Generativa Antagónica Condicional de Wasserstein con penalización de gradiente (WCGAN-GP) para la generación de datos sintéticos, la selección de características basada en algoritmos genéticos (GA-RF) para la reducción de dimensionalidad y el Bosque Aleatorio (RF) para la clasificación. El marco propuesto fue validado empíricamente en un conjunto de datos del mundo real de 16,000 reclamaciones de seguros de salud de una empresa de tecnología de salud china, caracterizado por una relación de desequilibrio de clases de 16:1 (5.9% de muestras fraudulentas) y 118 características originales. Utilizando una división estratificada de 80/20 para entrenamiento y prueba con resultados promediados en cinco ejecuciones independientes, el marco WCGAN-GA-RF logró una precisión del 96.47+/-0.5%, un recall del 97.05+/-0.4% y un F1-score del 96.26+/-0.4%. Notablemente, el componente GA-RF logró una reducción del 65% en las características (de 80 a 28 características) mientras mantenía una precisión de detección competitiva. Experimentos comparativos demuestran que el enfoque propuesto supera a los métodos convencionales de sobremuestreo, incluyendo el Sobremuestreo Aleatorio (ROS), la Técnica de Sobremuestreo de Minorías Sintéticas (SMOTE) y el Muestreo Sintético Adaptativo (ADASYN), particularmente en el manejo de datos de fraude en atención médica de alta dimensión y severamente desbalanceados.