logo móvil
Contáctanos

Las redes generativas adversarias para la generación de datos sintéticos en finanzas: evaluación de similitudes estadísticas y evaluación de calidad

Autores: Ramzan, Faisal; Sartori, Claudio; Consoli, Sergio; Reforgiato Recupero, Diego

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Las redes generativas adversarias para la generación de datos sintéticos en finanzas: evaluación de similitudes estadísticas y evaluación de calidad


Categoría

Ingeniería y Tecnología

Subcategoría

Inteligencia Artificial

Palabras clave

Datos sintéticos
Conjunto de datos
Aprendizaje automático
Mercado de valores
Redes generativas adversarias

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 19

Citaciones: Sin citaciones


Descripción
Generar datos sintéticos es una tarea compleja que requiere replicar con precisión las propiedades estadísticas y matemáticas de los elementos de datos originales. En sectores como las finanzas, utilizar y difundir datos reales para la investigación o el desarrollo de modelos puede plantear riesgos sustanciales para la privacidad debido a la inclusión de información sensible. Además, los datos auténticos pueden ser escasos, especialmente en dominios especializados donde adquirir datos suficientes, variados y de alta calidad es difícil o costoso. Esta escasez o disponibilidad limitada de datos puede limitar la capacitación y prueba de modelos de aprendizaje automático. En este documento, abordamos este desafío. En particular, nuestra tarea es sintetizar un conjunto de datos con propiedades similares a un conjunto de datos de entrada sobre el mercado de valores. El conjunto de datos de entrada está anonimizado y consta de muy pocas columnas y filas, contiene muchas inconsistencias, como filas faltantes y duplicadas, y sus valores no están normalizados, escalados o equilibrados. Exploramos la utilización de redes generativas adversarias, una técnica de aprendizaje profundo, para generar datos sintéticos y evaluar su calidad en comparación con el conjunto de datos de valores de entrada. Nuestra innovación implica generar conjuntos de datos artificiales que imitan las propiedades estadísticas de los elementos de entrada sin revelar información completa. Por ejemplo, los conjuntos de datos sintéticos pueden capturar la distribución de los precios de las acciones, los volúmenes de negociación y las tendencias del mercado observadas en el conjunto de datos original. Los conjuntos de datos generados cubren una gama más amplia de escenarios y variaciones, lo que permite a investigadores y profesionales explorar diferentes condiciones de mercado y estrategias de inversión. Esta diversidad puede mejorar la robustez y generalización de los modelos de aprendizaje automático. Evaluamos nuestros datos sintéticos en términos de la media, similitudes y correlaciones.

Otros recursos que podrían interesarte

Temas Virtualpro