logo móvil
Contáctanos

Un método de imputación híbrido para datos faltantes de múltiples patrones: un estudio de caso sobre el diagnóstico de diabetes tipo II

Autores: Nadimi-Shahraki, Mohammad H.; Mohammadi, Saeed; Zamani, Hoda; Gandomi, Mostafa; Gandomi, Amir H.

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Un método de imputación híbrido para datos faltantes de múltiples patrones: un estudio de caso sobre el diagnóstico de diabetes tipo II


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Conjuntos de datos médicos
Datos faltantes
Clasificadores
Atención médica inteligente
Sistemas de diagnóstico de enfermedades
Imputación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 33

Citaciones: Sin citaciones


Descripción
Los conjuntos de datos médicos reales suelen contener datos faltantes con diferentes patrones que disminuyen el rendimiento de los clasificadores utilizados en sistemas inteligentes de atención médica y diagnóstico de enfermedades. Muchos métodos se han propuesto para imputar datos faltantes, sin embargo, no cumplen con la necesidad de calidad de datos especialmente en conjuntos de datos reales con diferentes patrones de datos faltantes. En este documento, se introduce un modelo de cuatro capas, y luego se propone un método de imputación híbrido (HIMP) utilizando este modelo para imputar datos faltantes de múltiples patrones que incluyen patrones no aleatorios, aleatorios y completamente aleatorios. En HIMP, primero se imputan los patrones de datos faltantes no aleatorios, y luego el conjunto de datos obtenido se descompone en dos conjuntos de datos que contienen patrones de datos faltantes aleatorios y completamente aleatorios. Luego, según los patrones de datos faltantes en cada conjunto de datos, se utilizan diferentes métodos de imputación simple o múltiple. Finalmente, los mejores conjuntos de datos imputados obtenidos de los patrones aleatorios y completamente aleatorios se fusionan para formar el conjunto de datos final. La evaluación experimental se realizó con un conjunto de datos reales llamado IRDia que incluye los tres patrones de datos faltantes. El método propuesto y los métodos comparativos se compararon utilizando diferentes clasificadores en términos de precisión, exactitud, recuperación y puntuación F. El rendimiento de los clasificadores muestra que el HIMP puede imputar valores faltantes de múltiples patrones de manera más efectiva que otros métodos comparativos.

Otros recursos que podrían interesarte

Temas Virtualpro