Un método de imputación híbrido para datos faltantes de múltiples patrones: un estudio de caso sobre el diagnóstico de diabetes tipo II
Autores: Nadimi-Shahraki, Mohammad H.; Mohammadi, Saeed; Zamani, Hoda; Gandomi, Mostafa; Gandomi, Amir H.
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un método de imputación híbrido para datos faltantes de múltiples patrones: un estudio de caso sobre el diagnóstico de diabetes tipo II
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Conjuntos de datos médicos
Datos faltantes
Clasificadores
Atención médica inteligente
Sistemas de diagnóstico de enfermedades
Imputación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
Los conjuntos de datos médicos reales suelen contener datos faltantes con diferentes patrones que disminuyen el rendimiento de los clasificadores utilizados en sistemas inteligentes de atención médica y diagnóstico de enfermedades. Muchos métodos se han propuesto para imputar datos faltantes, sin embargo, no cumplen con la necesidad de calidad de datos especialmente en conjuntos de datos reales con diferentes patrones de datos faltantes. En este documento, se introduce un modelo de cuatro capas, y luego se propone un método de imputación híbrido (HIMP) utilizando este modelo para imputar datos faltantes de múltiples patrones que incluyen patrones no aleatorios, aleatorios y completamente aleatorios. En HIMP, primero se imputan los patrones de datos faltantes no aleatorios, y luego el conjunto de datos obtenido se descompone en dos conjuntos de datos que contienen patrones de datos faltantes aleatorios y completamente aleatorios. Luego, según los patrones de datos faltantes en cada conjunto de datos, se utilizan diferentes métodos de imputación simple o múltiple. Finalmente, los mejores conjuntos de datos imputados obtenidos de los patrones aleatorios y completamente aleatorios se fusionan para formar el conjunto de datos final. La evaluación experimental se realizó con un conjunto de datos reales llamado IRDia que incluye los tres patrones de datos faltantes. El método propuesto y los métodos comparativos se compararon utilizando diferentes clasificadores en términos de precisión, exactitud, recuperación y puntuación F. El rendimiento de los clasificadores muestra que el HIMP puede imputar valores faltantes de múltiples patrones de manera más efectiva que otros métodos comparativos.
Descripción
Los conjuntos de datos médicos reales suelen contener datos faltantes con diferentes patrones que disminuyen el rendimiento de los clasificadores utilizados en sistemas inteligentes de atención médica y diagnóstico de enfermedades. Muchos métodos se han propuesto para imputar datos faltantes, sin embargo, no cumplen con la necesidad de calidad de datos especialmente en conjuntos de datos reales con diferentes patrones de datos faltantes. En este documento, se introduce un modelo de cuatro capas, y luego se propone un método de imputación híbrido (HIMP) utilizando este modelo para imputar datos faltantes de múltiples patrones que incluyen patrones no aleatorios, aleatorios y completamente aleatorios. En HIMP, primero se imputan los patrones de datos faltantes no aleatorios, y luego el conjunto de datos obtenido se descompone en dos conjuntos de datos que contienen patrones de datos faltantes aleatorios y completamente aleatorios. Luego, según los patrones de datos faltantes en cada conjunto de datos, se utilizan diferentes métodos de imputación simple o múltiple. Finalmente, los mejores conjuntos de datos imputados obtenidos de los patrones aleatorios y completamente aleatorios se fusionan para formar el conjunto de datos final. La evaluación experimental se realizó con un conjunto de datos reales llamado IRDia que incluye los tres patrones de datos faltantes. El método propuesto y los métodos comparativos se compararon utilizando diferentes clasificadores en términos de precisión, exactitud, recuperación y puntuación F. El rendimiento de los clasificadores muestra que el HIMP puede imputar valores faltantes de múltiples patrones de manera más efectiva que otros métodos comparativos.