Modelo mejorado de detección de fraude con tarjetas de crédito utilizando aprendizaje automático
Autores: Alfaiz, Noor Saleh; Fati, Suliman Mohamed
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Modelo mejorado de detección de fraude con tarjetas de crédito utilizando aprendizaje automático
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Pandemia de covid-19
Servicios en línea
Tarjetas de crédito
Fraude
Aprendizaje automático
Transacciones fraudulentas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La pandemia de COVID-19 ha limitado la movilidad de las personas hasta cierto punto, lo que dificulta la compra de bienes y servicios fuera de línea, lo que ha llevado a la creación de una cultura de mayor dependencia de los servicios en línea. Uno de los problemas cruciales al usar tarjetas de crédito es el fraude, que es un desafío serio en el ámbito de las transacciones en línea. En consecuencia, existe una gran necesidad de desarrollar el mejor enfoque posible para utilizar el aprendizaje automático con el fin de prevenir casi todas las transacciones fraudulentas con tarjetas de crédito. Este documento estudia un total de 66 modelos de aprendizaje automático basados en dos etapas de evaluación. Se utiliza un conjunto de datos real de detección de fraude con tarjetas de crédito de titulares de tarjetas europeos en cada modelo junto con validación cruzada estratificada de K-fold. En la primera etapa, se prueban nueve algoritmos de aprendizaje automático para detectar transacciones fraudulentas. Los tres mejores algoritmos son nominados para ser utilizados nuevamente en la segunda etapa, con 19 técnicas de remuestreo utilizadas con cada uno de los tres mejores algoritmos. De los 330 valores de métricas de evaluación que tardaron casi un mes en obtenerse, la técnica de submuestreo All K-Nearest Neighbors (AllKNN) junto con CatBoost (AllKNN-CatBoost) se considera el mejor modelo propuesto. En consecuencia, el modelo AllKNN-CatBoost se compara con trabajos relacionados. Los resultados indican que el modelo propuesto supera a los modelos anteriores con un valor de AUC del 97,94%, un valor de Recall del 95,91% y un valor de 1-Score del 87,40%.
Descripción
La pandemia de COVID-19 ha limitado la movilidad de las personas hasta cierto punto, lo que dificulta la compra de bienes y servicios fuera de línea, lo que ha llevado a la creación de una cultura de mayor dependencia de los servicios en línea. Uno de los problemas cruciales al usar tarjetas de crédito es el fraude, que es un desafío serio en el ámbito de las transacciones en línea. En consecuencia, existe una gran necesidad de desarrollar el mejor enfoque posible para utilizar el aprendizaje automático con el fin de prevenir casi todas las transacciones fraudulentas con tarjetas de crédito. Este documento estudia un total de 66 modelos de aprendizaje automático basados en dos etapas de evaluación. Se utiliza un conjunto de datos real de detección de fraude con tarjetas de crédito de titulares de tarjetas europeos en cada modelo junto con validación cruzada estratificada de K-fold. En la primera etapa, se prueban nueve algoritmos de aprendizaje automático para detectar transacciones fraudulentas. Los tres mejores algoritmos son nominados para ser utilizados nuevamente en la segunda etapa, con 19 técnicas de remuestreo utilizadas con cada uno de los tres mejores algoritmos. De los 330 valores de métricas de evaluación que tardaron casi un mes en obtenerse, la técnica de submuestreo All K-Nearest Neighbors (AllKNN) junto con CatBoost (AllKNN-CatBoost) se considera el mejor modelo propuesto. En consecuencia, el modelo AllKNN-CatBoost se compara con trabajos relacionados. Los resultados indican que el modelo propuesto supera a los modelos anteriores con un valor de AUC del 97,94%, un valor de Recall del 95,91% y un valor de 1-Score del 87,40%.