Explorando enfoques innovadores para la generación de datos tabulares sintéticos
Autores: Papadaki, Eugenia; Vrahatis, Aristidis G.; Kotsiantis, Sotiris
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Explorando enfoques innovadores para la generación de datos tabulares sintéticos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Avance
Técnicas de generación de datos
Enfoques estadísticos
Basados en aprendizaje automático
Redes generativas adversarias (GANs)
Modelos predictivos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
El rápido avance de las técnicas de generación de datos ha impulsado la innovación en múltiples áreas. Este exhaustivo análisis profundiza en el ámbito de las metodologías de generación de datos, con un enfoque especial en enfoques estadísticos y basados en aprendizaje automático. Especialmente, estrategias novedosas como el enfoque de dividir y conquistar (DC) y modelos de vanguardia como GANBLR han surgido para abordar un espectro de desafíos, que van desde preservar relaciones de datos intrincadas hasta mejorar la interpretabilidad. Además, la integración de redes generativas adversarias (GANs) ha provocado una revolución en la generación de datos en sectores como la salud, ciberseguridad y venta al por menor. Este análisis examina meticulosamente cómo estas técnicas mitigan problemas como el desequilibrio de clases, la escasez de datos y las preocupaciones de privacidad. A través de un análisis meticuloso de métricas de evaluación y diversas aplicaciones, subraya la eficacia y el potencial de los datos sintéticos en la mejora de modelos predictivos y software de toma de decisiones. Concluyendo con ideas sobre trayectorias de investigación prospectivas y el papel en evolución de los datos sintéticos en impulsar soluciones de aprendizaje automático y basadas en datos en diversas disciplinas, este trabajo proporciona una comprensión holística del poder transformador de las metodologías de generación de datos contemporáneas.
Descripción
El rápido avance de las técnicas de generación de datos ha impulsado la innovación en múltiples áreas. Este exhaustivo análisis profundiza en el ámbito de las metodologías de generación de datos, con un enfoque especial en enfoques estadísticos y basados en aprendizaje automático. Especialmente, estrategias novedosas como el enfoque de dividir y conquistar (DC) y modelos de vanguardia como GANBLR han surgido para abordar un espectro de desafíos, que van desde preservar relaciones de datos intrincadas hasta mejorar la interpretabilidad. Además, la integración de redes generativas adversarias (GANs) ha provocado una revolución en la generación de datos en sectores como la salud, ciberseguridad y venta al por menor. Este análisis examina meticulosamente cómo estas técnicas mitigan problemas como el desequilibrio de clases, la escasez de datos y las preocupaciones de privacidad. A través de un análisis meticuloso de métricas de evaluación y diversas aplicaciones, subraya la eficacia y el potencial de los datos sintéticos en la mejora de modelos predictivos y software de toma de decisiones. Concluyendo con ideas sobre trayectorias de investigación prospectivas y el papel en evolución de los datos sintéticos en impulsar soluciones de aprendizaje automático y basadas en datos en diversas disciplinas, este trabajo proporciona una comprensión holística del poder transformador de las metodologías de generación de datos contemporáneas.