Un nuevo marco para la advertencia de riesgos que utiliza una red generativa adversaria mejorada y un impulso categórico
Autores: Peng, Yan; Liu, Yue; Wang, Jie; Li, Xiao
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un nuevo marco para la advertencia de riesgos que utiliza una red generativa adversaria mejorada y un impulso categórico
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Marco propuesto
SALGAN-CatBoost-SSAGA
Datos incompletos
Valores atípicos
Red generativa adversaria
Advertencia de riesgo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Para abordar los problemas de capacitación insuficiente y baja precisión en modelos de predicción con tamaño de muestra pequeño y datos incompletos, se propone en este documento un nuevo marco SALGAN-CatBoost-SSAGA. Utilizamos el algoritmo estándar de vecinos más cercanos (K-nearest neighbor) para interpolar los valores faltantes en datos incompletos, y empleamos EllipticEnvelope para identificar valores atípicos. SALGAN, una red generativa adversarial con un mecanismo de autoatención de conciencia de etiquetas, se utiliza para generar muestras virtuales y aumentar la diversidad de los datos de entrenamiento para el modelo. Para evitar óptimos locales y mejorar la precisión y estabilidad del modelo de predicción estándar CatBoost, se adopta una combinación mejorada del Algoritmo de Búsqueda de Gorrión (SSA)-Algoritmo Genético (GA) para construir un modelo CatBoost-SSAGA efectivo para la advertencia de riesgos, en el cual el SSAGA se utiliza para la optimización global de parámetros de CatBoost. Se utiliza un conjunto de datos de enfermedad cardíaca de UCI para la predicción de riesgos de enfermedades cardíacas. Los resultados experimentales muestran la superioridad del modelo propuesto en términos de precisión, exactitud, sensibilidad y valores de F1, así como el AUC.
Descripción
Para abordar los problemas de capacitación insuficiente y baja precisión en modelos de predicción con tamaño de muestra pequeño y datos incompletos, se propone en este documento un nuevo marco SALGAN-CatBoost-SSAGA. Utilizamos el algoritmo estándar de vecinos más cercanos (K-nearest neighbor) para interpolar los valores faltantes en datos incompletos, y empleamos EllipticEnvelope para identificar valores atípicos. SALGAN, una red generativa adversarial con un mecanismo de autoatención de conciencia de etiquetas, se utiliza para generar muestras virtuales y aumentar la diversidad de los datos de entrenamiento para el modelo. Para evitar óptimos locales y mejorar la precisión y estabilidad del modelo de predicción estándar CatBoost, se adopta una combinación mejorada del Algoritmo de Búsqueda de Gorrión (SSA)-Algoritmo Genético (GA) para construir un modelo CatBoost-SSAGA efectivo para la advertencia de riesgos, en el cual el SSAGA se utiliza para la optimización global de parámetros de CatBoost. Se utiliza un conjunto de datos de enfermedad cardíaca de UCI para la predicción de riesgos de enfermedades cardíacas. Los resultados experimentales muestran la superioridad del modelo propuesto en términos de precisión, exactitud, sensibilidad y valores de F1, así como el AUC.