Un algoritmo de imputación basado en la similitud de vecindario para conjuntos de datos de atención médica: un estudio comparativo
Autores: Wilcox, Colin; Giagos, Vasileios; Djahel, Soufiene
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un algoritmo de imputación basado en la similitud de vecindario para conjuntos de datos de atención médica: un estudio comparativo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Informática
Servicios médicos
Datos médicos históricos
Inconsistencias
Técnicas de imputación
Precisión de predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
La creciente informatización de los servicios médicos ha resaltado inconsistencias en la forma en que se registraron los datos médicos históricos de los pacientes. Las diferencias en los procesos y prácticas entre los servicios e instalaciones médicas han llevado a que se registren muchas historias clínicas incompletas e inexactas. Para crear un único punto de verdad en el futuro, es necesario corregir estas inconsistencias. Una forma común de hacerlo ha sido utilizar técnicas de imputación para predecir los valores de datos faltantes en función de los valores conocidos en el conjunto de datos. En este documento, proponemos una técnica de imputación basada en una medida de similitud de vecindario y analizamos su precisión de predicción lograda en comparación con varios métodos de imputación tradicionales utilizando tanto un conjunto de datos médicos de diabetes anonimizado e incompleto como varias simulaciones como fuentes de nuestros datos. El objetivo es determinar si se podría mejorar la precisión de predecir un diagnóstico de diabetes utilizando los resultados conocidos del conjunto de datos de los pacientes diabéticos. Los resultados obtenidos han demostrado la efectividad de nuestro enfoque propuesto en comparación con otras técnicas de imputación de paso único de vanguardia.
Descripción
La creciente informatización de los servicios médicos ha resaltado inconsistencias en la forma en que se registraron los datos médicos históricos de los pacientes. Las diferencias en los procesos y prácticas entre los servicios e instalaciones médicas han llevado a que se registren muchas historias clínicas incompletas e inexactas. Para crear un único punto de verdad en el futuro, es necesario corregir estas inconsistencias. Una forma común de hacerlo ha sido utilizar técnicas de imputación para predecir los valores de datos faltantes en función de los valores conocidos en el conjunto de datos. En este documento, proponemos una técnica de imputación basada en una medida de similitud de vecindario y analizamos su precisión de predicción lograda en comparación con varios métodos de imputación tradicionales utilizando tanto un conjunto de datos médicos de diabetes anonimizado e incompleto como varias simulaciones como fuentes de nuestros datos. El objetivo es determinar si se podría mejorar la precisión de predecir un diagnóstico de diabetes utilizando los resultados conocidos del conjunto de datos de los pacientes diabéticos. Los resultados obtenidos han demostrado la efectividad de nuestro enfoque propuesto en comparación con otras técnicas de imputación de paso único de vanguardia.