Mejorando el rendimiento de clasificación en la detección de fraudes con tarjetas de crédito mediante el uso de nueva ampliación de datos
Autores: Strelcenia, Emilija; Prakoonwit, Simant
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Mejorando el rendimiento de clasificación en la detección de fraudes con tarjetas de crédito mediante el uso de nueva ampliación de datos
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Tarjetas de crédito
Fraude
Transacciones
Aprendizaje automático
Aumento de datos
K-CGAN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
En muchas naciones industrializadas y en desarrollo, las tarjetas de crédito son uno de los métodos de pago más ampliamente utilizados para transacciones en línea. El invento de la tarjeta de crédito ha simplificado, facilitado y mejorado las transacciones en internet. Sin embargo, también ha dado a los criminales más oportunidades para cometer fraudes, lo que ha aumentado la tasa de fraudes. El fraude con tarjetas de crédito tiene un impacto global preocupante; muchas empresas y usuarios comunes han perdido millones de dólares estadounidenses como resultado. Dado el gran número de transacciones, muchas empresas y organizaciones dependen en gran medida de la aplicación de técnicas de aprendizaje automático para clasificar o identificar automáticamente transacciones fraudulentas. Dado que el rendimiento de las técnicas de aprendizaje automático depende en gran medida de la calidad de los datos de entrenamiento, el desequilibrio en los datos no es un problema trivial. En general, solo un pequeño porcentaje de transacciones fraudulentas se presenta en los datos. Esto afecta en gran medida el rendimiento de los clasificadores de aprendizaje automático. Para hacer frente a la rareza de las ocurrencias fraudulentas, este documento investiga una variedad de técnicas de aumento de datos para abordar el problema de desequilibrio de datos e introduce un nuevo modelo de aumento de datos, K-CGAN, para la detección de fraudes con tarjetas de crédito. Luego se utilizan varias de las principales técnicas de clasificación para evaluar el rendimiento de las técnicas de aumento. Estos resultados muestran que B-SMOTE, K-CGAN y SMOTE tienen la mayor Precisión y Recall en comparación con otros métodos de aumento. Entre ellos, K-CGAN tiene el mayor Puntaje F1 y Precisión.
Descripción
En muchas naciones industrializadas y en desarrollo, las tarjetas de crédito son uno de los métodos de pago más ampliamente utilizados para transacciones en línea. El invento de la tarjeta de crédito ha simplificado, facilitado y mejorado las transacciones en internet. Sin embargo, también ha dado a los criminales más oportunidades para cometer fraudes, lo que ha aumentado la tasa de fraudes. El fraude con tarjetas de crédito tiene un impacto global preocupante; muchas empresas y usuarios comunes han perdido millones de dólares estadounidenses como resultado. Dado el gran número de transacciones, muchas empresas y organizaciones dependen en gran medida de la aplicación de técnicas de aprendizaje automático para clasificar o identificar automáticamente transacciones fraudulentas. Dado que el rendimiento de las técnicas de aprendizaje automático depende en gran medida de la calidad de los datos de entrenamiento, el desequilibrio en los datos no es un problema trivial. En general, solo un pequeño porcentaje de transacciones fraudulentas se presenta en los datos. Esto afecta en gran medida el rendimiento de los clasificadores de aprendizaje automático. Para hacer frente a la rareza de las ocurrencias fraudulentas, este documento investiga una variedad de técnicas de aumento de datos para abordar el problema de desequilibrio de datos e introduce un nuevo modelo de aumento de datos, K-CGAN, para la detección de fraudes con tarjetas de crédito. Luego se utilizan varias de las principales técnicas de clasificación para evaluar el rendimiento de las técnicas de aumento. Estos resultados muestran que B-SMOTE, K-CGAN y SMOTE tienen la mayor Precisión y Recall en comparación con otros métodos de aumento. Entre ellos, K-CGAN tiene el mayor Puntaje F1 y Precisión.