Negación de la reevaluación de la evolución: un método mejorado para la selección de características en datos desequilibrados
Autores: Quan, Li; Gong, Tao; Jiang, Kaida
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Negación de la reevaluación de la evolución: un método mejorado para la selección de características en datos desequilibrados
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Datos desequilibrados
Algoritmos de clasificación
Método de remuestreo de datos
Proceso de selección negativa
Coeficientes de regresión
Regresión logística
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
La clasificación de datos desequilibrados es un problema importante en el campo de la informática. Los algoritmos de clasificación tradicionales a menudo experimentan una disminución en la precisión cuando la distribución de los datos es desigual. Por lo tanto, es necesario tomar medidas para mejorar el equilibrio del conjunto de datos y aumentar la precisión de clasificación del modelo. Hemos diseñado un método de remuestreo de datos para mejorar la precisión de detección de clasificación. Este método se basa en el proceso de selección negativa para limitar el proceso de evolución de los datos. Al combinar el método CRITIC con coeficientes de regresión, establecemos probabilidades de selección de cruce para genes élite para lograr un proceso de remuestreo evolutivo. Basándonos en pesos independientes, el análisis de características mejora en un 3%. Evaluamos los resultados remuestreados en conjuntos de datos disponibles públicamente utilizando regresión logística tradicional con validación cruzada. En comparación con otros modelos de remuestreo, el rendimiento de la puntuación F1 de la validación cruzada de cinco pliegues de regresión logística es más estable que los otros métodos utilizando los dos resultados de muestreo del método propuesto. La efectividad del método propuesto se verifica en base a los resultados de evaluación de la puntuación F1.
Descripción
La clasificación de datos desequilibrados es un problema importante en el campo de la informática. Los algoritmos de clasificación tradicionales a menudo experimentan una disminución en la precisión cuando la distribución de los datos es desigual. Por lo tanto, es necesario tomar medidas para mejorar el equilibrio del conjunto de datos y aumentar la precisión de clasificación del modelo. Hemos diseñado un método de remuestreo de datos para mejorar la precisión de detección de clasificación. Este método se basa en el proceso de selección negativa para limitar el proceso de evolución de los datos. Al combinar el método CRITIC con coeficientes de regresión, establecemos probabilidades de selección de cruce para genes élite para lograr un proceso de remuestreo evolutivo. Basándonos en pesos independientes, el análisis de características mejora en un 3%. Evaluamos los resultados remuestreados en conjuntos de datos disponibles públicamente utilizando regresión logística tradicional con validación cruzada. En comparación con otros modelos de remuestreo, el rendimiento de la puntuación F1 de la validación cruzada de cinco pliegues de regresión logística es más estable que los otros métodos utilizando los dos resultados de muestreo del método propuesto. La efectividad del método propuesto se verifica en base a los resultados de evaluación de la puntuación F1.