Estimando la Utilidad de Usar Datos Estructurados y No Estructurados para Extraer Incidentes de Hospitalizaciones Externas de Documentos de Pacientes
Autores: Davenport, Michael; Hall, Robert; Kappala, Saraswathi; Michelson, Trevor; Mitchell, Robert; Winski, David; Hau, Cynthia; Leatherman, Sarah; Meng, Frank
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Estimando la Utilidad de Usar Datos Estructurados y No Estructurados para Extraer Incidentes de Hospitalizaciones Externas de Documentos de Pacientes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Opción
Hospitalizaciones externas
Sistema de salud de VA
Datos
Estructurados
No estructurados
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los pacientes dentro del sistema de salud del Departamento de Asuntos de Veteranos de EE. UU. (VA) tienen la opción de recibir atención en instalaciones externas a la red del VA. Este trabajo presenta un método para identificar hospitalizaciones externas entre la población de pacientes del VA utilizando datos almacenados en los registros de pacientes. El proceso de extracción de esta información se complica por el hecho de que los indicadores de hospitalizaciones externas provienen de dos fuentes: datos estructurados bien definidos y texto no estructurado en forma libre. Aunque el procesamiento de lenguaje natural (NLP) que aprovecha los Modelos de Lenguaje Grande (LLMs) ha avanzado en capacidades para automatizar la extracción de información de texto libre, implementar estos sistemas sigue siendo complejo y costoso. Utilizar datos estructurados es de bajo costo, pero su utilidad debe determinarse para asignar recursos de manera óptima. Describimos un método para estimar la utilidad de usar datos estructurados y no estructurados y mostramos que si se cumplen ciertas condiciones, el nivel de esfuerzo para realizar esta estimación puede reducirse considerablemente. Para las hospitalizaciones externas en el VA, nuestro análisis mostró que el 44.4% de los casos identificados utilizando datos no estructurados no pudieron ser encontrados utilizando solo datos estructurados.
Descripción
Los pacientes dentro del sistema de salud del Departamento de Asuntos de Veteranos de EE. UU. (VA) tienen la opción de recibir atención en instalaciones externas a la red del VA. Este trabajo presenta un método para identificar hospitalizaciones externas entre la población de pacientes del VA utilizando datos almacenados en los registros de pacientes. El proceso de extracción de esta información se complica por el hecho de que los indicadores de hospitalizaciones externas provienen de dos fuentes: datos estructurados bien definidos y texto no estructurado en forma libre. Aunque el procesamiento de lenguaje natural (NLP) que aprovecha los Modelos de Lenguaje Grande (LLMs) ha avanzado en capacidades para automatizar la extracción de información de texto libre, implementar estos sistemas sigue siendo complejo y costoso. Utilizar datos estructurados es de bajo costo, pero su utilidad debe determinarse para asignar recursos de manera óptima. Describimos un método para estimar la utilidad de usar datos estructurados y no estructurados y mostramos que si se cumplen ciertas condiciones, el nivel de esfuerzo para realizar esta estimación puede reducirse considerablemente. Para las hospitalizaciones externas en el VA, nuestro análisis mostró que el 44.4% de los casos identificados utilizando datos no estructurados no pudieron ser encontrados utilizando solo datos estructurados.