Una arquitectura que preserva la privacidad y basada en estándares para el uso secundario de datos clínicos
Autores: Ciampi, Mario; Sicuranza, Mario; Silvestri, Stefano
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Una arquitectura que preserva la privacidad y basada en estándares para el uso secundario de datos clínicos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Formatos
Estándares
Datos clínicos
Aprendizaje automático
Análisis de grandes datos
Anonimización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La heterogeneidad de los formatos y estándares de los datos clínicos, que incluye datos estructurados, semi-estructurados y no estructurados, además de la información sensible que contienen, requiere la definición de enfoques específicos que sean capaces de implementar metodologías que permitan la extracción de información valiosa enterrada bajo dichos datos. Aunque aún existen muchos desafíos y problemas que no se han abordado completamente cuando esta información debe ser procesada y utilizada para otros fines, las técnicas más recientes basadas en el aprendizaje automático y el análisis de grandes datos pueden apoyar el proceso de extracción de información para el uso secundario de los datos clínicos. En particular, estas técnicas pueden facilitar la transformación de datos heterogéneos en un formato estándar común. Además, también pueden ser aprovechadas para definir enfoques de anonimización o seudonimización, respetando los requisitos de privacidad establecidos en el Reglamento General de Protección de Datos, la Ley de Portabilidad y Responsabilidad de Seguros de Salud y otras leyes nacionales y regionales. De hecho, el cumplimiento de estas leyes requiere que solo se puedan procesar datos clínicos y personales desidentificados para análisis secundarios, en particular cuando los datos se comparten o intercambian entre diferentes instituciones. Este trabajo propone una arquitectura modular capaz de recopilar datos clínicos de fuentes heterogéneas y transformarlos en datos útiles para usos secundarios, como investigación, gobernanza y propósitos de educación médica. La arquitectura propuesta es capaz de explotar módulos y algoritmos apropiados, llevar a cabo transformaciones (seudonimización y estandarización) requeridas para utilizar los datos para los segundos fines, así como proporcionar herramientas eficientes para facilitar los procesos de recuperación y análisis. Las pruebas experimentales preliminares muestran buena precisión en términos de evaluaciones cuantitativas.
Descripción
La heterogeneidad de los formatos y estándares de los datos clínicos, que incluye datos estructurados, semi-estructurados y no estructurados, además de la información sensible que contienen, requiere la definición de enfoques específicos que sean capaces de implementar metodologías que permitan la extracción de información valiosa enterrada bajo dichos datos. Aunque aún existen muchos desafíos y problemas que no se han abordado completamente cuando esta información debe ser procesada y utilizada para otros fines, las técnicas más recientes basadas en el aprendizaje automático y el análisis de grandes datos pueden apoyar el proceso de extracción de información para el uso secundario de los datos clínicos. En particular, estas técnicas pueden facilitar la transformación de datos heterogéneos en un formato estándar común. Además, también pueden ser aprovechadas para definir enfoques de anonimización o seudonimización, respetando los requisitos de privacidad establecidos en el Reglamento General de Protección de Datos, la Ley de Portabilidad y Responsabilidad de Seguros de Salud y otras leyes nacionales y regionales. De hecho, el cumplimiento de estas leyes requiere que solo se puedan procesar datos clínicos y personales desidentificados para análisis secundarios, en particular cuando los datos se comparten o intercambian entre diferentes instituciones. Este trabajo propone una arquitectura modular capaz de recopilar datos clínicos de fuentes heterogéneas y transformarlos en datos útiles para usos secundarios, como investigación, gobernanza y propósitos de educación médica. La arquitectura propuesta es capaz de explotar módulos y algoritmos apropiados, llevar a cabo transformaciones (seudonimización y estandarización) requeridas para utilizar los datos para los segundos fines, así como proporcionar herramientas eficientes para facilitar los procesos de recuperación y análisis. Las pruebas experimentales preliminares muestran buena precisión en términos de evaluaciones cuantitativas.