Hacia la garantía de la calidad de los datos en repositorios de imágenes de cáncer en múltiples sitios
Autores: Kosvyra, Alexandra; Filos, Dimitrios T.; Fotopoulos, Dimitris Th.; Tsave, Olga; Chouvarda, Ioanna
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Hacia la garantía de la calidad de los datos en repositorios de imágenes de cáncer en múltiples sitios
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Cáncer
Inteligencia artificial
Calidad de datos
Metodología
Integración de datos
Impulsado por IA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El cáncer sigue siendo un importante desafío de salud global, afectando a diversas poblaciones en diferentes demografías. La integración de la Inteligencia Artificial (IA) en entornos clínicos para mejorar la predicción de resultados de enfermedades presenta desafíos notables. Este estudio aborda las limitaciones de la atención oncológica impulsada por IA debido a conjuntos de datos de baja calidad, proponiendo una metodología integral de tres pasos para garantizar una alta calidad de los datos en repositorios de imágenes de cáncer a gran escala. Nuestra metodología abarca (i) el desarrollo de un Modelo Conceptual de Calidad de Datos con métricas específicas para la evaluación, (ii) la creación de un protocolo detallado de recolección de datos y un conjunto de reglas para asegurar la homogeneidad de los datos y la correcta integración de datos de múltiples fuentes, y (iii) la implementación de una Herramienta de Verificación de Calidad de Integración de Datos (DIQCT) para verificar el cumplimiento de los requisitos de calidad y sugerir acciones correctivas. Estos pasos están diseñados para mitigar sesgos, mejorar la integridad de los datos y asegurar que los datos integrados cumplan con altos estándares de calidad. Aplicamos esta metodología dentro del proyecto INCISIVE, una iniciativa financiada por la UE destinada a un repositorio pan-europeo de imágenes de cáncer. El caso de uso demostró la efectividad de nuestro enfoque en la definición de reglas de calidad y la evaluación del cumplimiento, resultando en una mejor integración de datos y una mayor calidad de los datos. La metodología propuesta puede ayudar en el despliegue de repositorios centralizados o distribuidos de grandes datos con información de diversas fuentes de datos, facilitando así el desarrollo de herramientas de IA.
Descripción
El cáncer sigue siendo un importante desafío de salud global, afectando a diversas poblaciones en diferentes demografías. La integración de la Inteligencia Artificial (IA) en entornos clínicos para mejorar la predicción de resultados de enfermedades presenta desafíos notables. Este estudio aborda las limitaciones de la atención oncológica impulsada por IA debido a conjuntos de datos de baja calidad, proponiendo una metodología integral de tres pasos para garantizar una alta calidad de los datos en repositorios de imágenes de cáncer a gran escala. Nuestra metodología abarca (i) el desarrollo de un Modelo Conceptual de Calidad de Datos con métricas específicas para la evaluación, (ii) la creación de un protocolo detallado de recolección de datos y un conjunto de reglas para asegurar la homogeneidad de los datos y la correcta integración de datos de múltiples fuentes, y (iii) la implementación de una Herramienta de Verificación de Calidad de Integración de Datos (DIQCT) para verificar el cumplimiento de los requisitos de calidad y sugerir acciones correctivas. Estos pasos están diseñados para mitigar sesgos, mejorar la integridad de los datos y asegurar que los datos integrados cumplan con altos estándares de calidad. Aplicamos esta metodología dentro del proyecto INCISIVE, una iniciativa financiada por la UE destinada a un repositorio pan-europeo de imágenes de cáncer. El caso de uso demostró la efectividad de nuestro enfoque en la definición de reglas de calidad y la evaluación del cumplimiento, resultando en una mejor integración de datos y una mayor calidad de los datos. La metodología propuesta puede ayudar en el despliegue de repositorios centralizados o distribuidos de grandes datos con información de diversas fuentes de datos, facilitando así el desarrollo de herramientas de IA.