Prediciendo fraude en servicios de pago financiero a través de un modelo XGBoost optimizado con hiperparámetros ajustados
Autores: Dalal, Surjeet; Seth, Bijeta; Radulescu, Magdalena; Secara, Carmen; Tolea, Claudia
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Prediciendo fraude en servicios de pago financiero a través de un modelo XGBoost optimizado con hiperparámetros ajustados
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Transacciones
Fraude
Financiero
Aprendizaje automático
Algoritmos
Conjunto de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Las transacciones en línea, los servicios médicos, las transacciones financieras y bancarias tienen su parte de actividad fraudulenta. Los ingresos anuales generados por el fraude superan el $1 billón. Aunque el fraude es peligroso para las organizaciones, puede ser descubierto con la ayuda de soluciones inteligentes como motores de reglas y aprendizaje automático. En esta investigación, presentamos una técnica híbrida única para identificar el fraude en pagos financieros combinando el ajuste de hiperparámetros basado en la naturaleza con varios modelos de clasificadores supervisados, implementados en una versión modificada del Algoritmo XGBoost. Al principio, separamos una muestra del conjunto de datos completo de pagos financieros para usar como conjunto de prueba. Utilizamos el 70% de los datos para entrenamiento y el 30% para pruebas. Se predicen los registros que se sabe que son ilegítimos o fraudulentos, mientras que aquellos que levantan sospechas son investigados más a fondo utilizando varios algoritmos de aprendizaje automático. Los modelos se entrenan y validan utilizando la técnica de validación cruzada de 10 pliegues. Se realizan varias pruebas utilizando un conjunto de datos de transacciones financieras reales para demostrar la efectividad del enfoque propuesto.
Descripción
Las transacciones en línea, los servicios médicos, las transacciones financieras y bancarias tienen su parte de actividad fraudulenta. Los ingresos anuales generados por el fraude superan el $1 billón. Aunque el fraude es peligroso para las organizaciones, puede ser descubierto con la ayuda de soluciones inteligentes como motores de reglas y aprendizaje automático. En esta investigación, presentamos una técnica híbrida única para identificar el fraude en pagos financieros combinando el ajuste de hiperparámetros basado en la naturaleza con varios modelos de clasificadores supervisados, implementados en una versión modificada del Algoritmo XGBoost. Al principio, separamos una muestra del conjunto de datos completo de pagos financieros para usar como conjunto de prueba. Utilizamos el 70% de los datos para entrenamiento y el 30% para pruebas. Se predicen los registros que se sabe que son ilegítimos o fraudulentos, mientras que aquellos que levantan sospechas son investigados más a fondo utilizando varios algoritmos de aprendizaje automático. Los modelos se entrenan y validan utilizando la técnica de validación cruzada de 10 pliegues. Se realizan varias pruebas utilizando un conjunto de datos de transacciones financieras reales para demostrar la efectividad del enfoque propuesto.