Manejo de valores faltantes basado en clasificadores de similitud y medidas de entropía difusa

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Manejo de valores faltantes basado en clasificadores de similitud y medidas de entropía difusa

Autores: Karim, Faten Khalid; Elmannai, Hela; Seleem, Abdelrahman; Hamad, Safwat; Mostafa, Samih M.

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico

2022

Manejo de valores faltantes basado en clasificadores de similitud y medidas de entropía difusa

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Manejo

Valores faltantes

Selección de características

Tareas de preprocesamiento

Aprendizaje automático

Regresión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones

El manejo de valores faltantes (MVs) y la selección de características (FS) son tareas de preprocesamiento vitales para muchas aplicaciones de reconocimiento de patrones, minería de datos y aprendizaje automático (ML), que implican problemas de clasificación y regresión. La existencia de MVs en los datos afecta negativamente la toma de decisiones. Por lo tanto, los MVs deben tenerse en cuenta durante las tareas de preprocesamiento como un problema crítico. En este sentido, los autores propusieron un nuevo algoritmo para manipular MVs utilizando FS. La regresión de la cresta bayesiana (BRR) es el tipo más beneficioso de regresión bayesiana. BRR estima un modelo probabilístico del problema de regresión. El algoritmo propuesto se llama regresión de cresta bayesiana acumulativa con medida de entropía difusa de similitud de Luca (CBRSL). CBRSL revela cómo la entropía difusa FS utilizada para seleccionar la característica candidata que contiene MVs ayuda en la predicción de los MVs dentro de la característica seleccionada utilizando la técnica de la Cresta Bayesiana. CBRSL se puede utilizar para manipular MVs dentro de otras características de forma acumulativa; las características completadas se incorporan dentro de la ecuación BRR para predecir los MVs de la próxima característica incompleta seleccionada. Se realizó un análisis experimental en cuatro conjuntos de datos con MVs generados a partir de tres mecanismos de falta de datos para comparar CBRSL con métodos de imputación prácticos de vanguardia. El rendimiento se midió en términos de R score (coeficiente de determinación), RMSE (error cuadrático medio) y MAE (error absoluto medio). Los resultados experimentales indican que la precisión y los tiempos de ejecución difieren según la cantidad de MVs, el tamaño del conjunto de datos y el tipo de mecanismo de falta de datos. Además, los resultados muestran que CBRSL puede manipular MVs generados por cualquier mecanismo de falta de datos con una precisión competitiva frente a los métodos comparados.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro