Desenmascarando el Fraude Bancario: Desatando el Poder del Aprendizaje Automático y la Inteligencia Artificial Explicable (XAI) en Datos Desequilibrados
Autores: Nobel, S. M. Nuruzzaman; Sultana, Shirin; Singha, Sondip Poul; Chaki, Sudipto; Mahi, Md. Julkar Nayeen; Jan, Tony; Barros, Alistair; Whaiduzzaman, Md
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Desenmascarando el Fraude Bancario: Desatando el Poder del Aprendizaje Automático y la Inteligencia Artificial Explicable (XAI) en Datos Desequilibrados
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Actividad fraudulenta
Sistema bancario
Algoritmos de aprendizaje automático
XGBoost
Desequilibrio de clases
Detección de fraudes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Reconocer la actividad fraudulenta en el sistema bancario es esencial debido a los riesgos significativos involucrados. Cuando las transacciones fraudulentas son ampliamente superadas por las no fraudulentas, lidiar con conjuntos de datos desbalanceados puede ser difícil. Este estudio tiene como objetivo determinar el mejor modelo para detectar fraudes comparando cuatro algoritmos de aprendizaje automático comúnmente utilizados: Máquina de Vectores de Soporte (SVM), XGBoost, Árbol de Decisión y Regresión Logística. Además, utilizamos la Técnica de Sobremuestreo de Minorías Sintéticas (SMOTE) para abordar el problema del desbalance de clases. El Clasificador XGBoost demostró ser el modelo más exitoso para la detección de fraudes, con una precisión del 99.88%. Utilizamos análisis SHAP y LIME para proporcionar una mayor claridad en el proceso de toma de decisiones del modelo XGBoost y mejorar la comprensión general. Esta investigación muestra que el Clasificador XGBoost es altamente efectivo en la detección de fraudes bancarios en conjuntos de datos desbalanceados, con una impresionante puntuación de precisión. La interpretabilidad del modelo Clasificador XGBoost se mejoró aún más al aplicar análisis SHAP y LIME, que arrojaron luz sobre las características significativas que contribuyen a la detección de fraudes. Los conocimientos y hallazgos presentados aquí son contribuciones valiosas a los esfuerzos en curso destinados a desarrollar sistemas efectivos de detección de fraudes para la industria bancaria.
Descripción
Reconocer la actividad fraudulenta en el sistema bancario es esencial debido a los riesgos significativos involucrados. Cuando las transacciones fraudulentas son ampliamente superadas por las no fraudulentas, lidiar con conjuntos de datos desbalanceados puede ser difícil. Este estudio tiene como objetivo determinar el mejor modelo para detectar fraudes comparando cuatro algoritmos de aprendizaje automático comúnmente utilizados: Máquina de Vectores de Soporte (SVM), XGBoost, Árbol de Decisión y Regresión Logística. Además, utilizamos la Técnica de Sobremuestreo de Minorías Sintéticas (SMOTE) para abordar el problema del desbalance de clases. El Clasificador XGBoost demostró ser el modelo más exitoso para la detección de fraudes, con una precisión del 99.88%. Utilizamos análisis SHAP y LIME para proporcionar una mayor claridad en el proceso de toma de decisiones del modelo XGBoost y mejorar la comprensión general. Esta investigación muestra que el Clasificador XGBoost es altamente efectivo en la detección de fraudes bancarios en conjuntos de datos desbalanceados, con una impresionante puntuación de precisión. La interpretabilidad del modelo Clasificador XGBoost se mejoró aún más al aplicar análisis SHAP y LIME, que arrojaron luz sobre las características significativas que contribuyen a la detección de fraudes. Los conocimientos y hallazgos presentados aquí son contribuciones valiosas a los esfuerzos en curso destinados a desarrollar sistemas efectivos de detección de fraudes para la industria bancaria.