logo móvil
Contáctanos

Manejo de valores faltantes basado en clasificadores de similitud y medidas de entropía difusa

Autores: Karim, Faten Khalid; Elmannai, Hela; Seleem, Abdelrahman; Hamad, Safwat; Mostafa, Samih M.

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Manejo de valores faltantes basado en clasificadores de similitud y medidas de entropía difusa


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Manejo
Valores faltantes
Selección de características
Tareas de preprocesamiento
Aprendizaje automático
Regresión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
El manejo de valores faltantes (MVs) y la selección de características (FS) son tareas de preprocesamiento vitales para muchas aplicaciones de reconocimiento de patrones, minería de datos y aprendizaje automático (ML), que implican problemas de clasificación y regresión. La existencia de MVs en los datos afecta negativamente la toma de decisiones. Por lo tanto, los MVs deben tenerse en cuenta durante las tareas de preprocesamiento como un problema crítico. En este sentido, los autores propusieron un nuevo algoritmo para manipular MVs utilizando FS. La regresión de la cresta bayesiana (BRR) es el tipo más beneficioso de regresión bayesiana. BRR estima un modelo probabilístico del problema de regresión. El algoritmo propuesto se llama regresión de cresta bayesiana acumulativa con medida de entropía difusa de similitud de Luca (CBRSL). CBRSL revela cómo la entropía difusa FS utilizada para seleccionar la característica candidata que contiene MVs ayuda en la predicción de los MVs dentro de la característica seleccionada utilizando la técnica de la Cresta Bayesiana. CBRSL se puede utilizar para manipular MVs dentro de otras características de forma acumulativa; las características completadas se incorporan dentro de la ecuación BRR para predecir los MVs de la próxima característica incompleta seleccionada. Se realizó un análisis experimental en cuatro conjuntos de datos con MVs generados a partir de tres mecanismos de falta de datos para comparar CBRSL con métodos de imputación prácticos de vanguardia. El rendimiento se midió en términos de R score (coeficiente de determinación), RMSE (error cuadrático medio) y MAE (error absoluto medio). Los resultados experimentales indican que la precisión y los tiempos de ejecución difieren según la cantidad de MVs, el tamaño del conjunto de datos y el tipo de mecanismo de falta de datos. Además, los resultados muestran que CBRSL puede manipular MVs generados por cualquier mecanismo de falta de datos con una precisión competitiva frente a los métodos comparados.

Otros recursos que podrían interesarte

Temas Virtualpro