Integrando Inteligencia Artificial Agente para Automatizar la Clasificación Internacional de Enfermedades, Décima Revisión, Codificación Médica
Autores: Akkhawatthanakun, Kitti; Narupiyakul, Lalita; Wongpatikaseree, Konlakorn; Hnoohom, Narit; Termritthikun, Chakkrit; Muneesawang, Paisarn
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Integrando Inteligencia Artificial Agente para Automatizar la Clasificación Internacional de Enfermedades, Décima Revisión, Codificación Médica
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Automatización
Codificación ICD-10
Resúmenes de alta
Sistema de aprendizaje profundo
Narrativas clínicas
Enfoque híbrido
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La automatización de la codificación ICD-10 a partir de resúmenes de alta sigue siendo exigente porque los codificadores analizan narrativas clínicas mientras justifican decisiones. Este estudio compara tres patrones de automatización: PLM-ICD como un sistema de aprendizaje profundo independiente que emite 15 códigos por caso, generación solo con LLM con plena autonomía, y un enfoque híbrido donde PLM-ICD elabora candidatos para una auditoría de LLM agente que acepta o rechaza. Todas las estrategias se evaluaron en 19,801 resúmenes de MIMIC-IV utilizando cuatro LLM que abarcan desde compactos (Qwen2.5-3B-Instruct, Llama-3.2-3B-Instruct, Phi-4-mini-instruct) hasta a gran escala (Sonnet-4.5). La evaluación guiada por precisión porque los codificadores aún proporcionan cualquier diagnóstico que falte. PLM-ICD solo alcanzó un 55.8% de precisión mientras siempre presentaba 15 sugerencias. La generación solo con LLM se quedó muy atrás (1.5-34.6% de precisión) y produjo tamaños de salida inconsistentes. La auditoría agente ofreció el mejor equilibrio: los LLM compactos revisaron los 15 candidatos, descartaron evidencia débil y devolvieron de 2 a 8 códigos de alta confianza. Llama-3.2-3B-Instruct, por ejemplo, mejoró del 1.5% como generador al 55.1% como verificador mientras recortaba falsos positivos en un 73%. Estos resultados muestran que posicionar a los LLM como controladores de calidad, en lugar de generadores primarios, proporciona un apoyo confiable para los equipos de codificación clínica, mientras que la presentación formal de recall/F1 sigue siendo un trabajo futuro para implementaciones completamente autónomas.
Descripción
La automatización de la codificación ICD-10 a partir de resúmenes de alta sigue siendo exigente porque los codificadores analizan narrativas clínicas mientras justifican decisiones. Este estudio compara tres patrones de automatización: PLM-ICD como un sistema de aprendizaje profundo independiente que emite 15 códigos por caso, generación solo con LLM con plena autonomía, y un enfoque híbrido donde PLM-ICD elabora candidatos para una auditoría de LLM agente que acepta o rechaza. Todas las estrategias se evaluaron en 19,801 resúmenes de MIMIC-IV utilizando cuatro LLM que abarcan desde compactos (Qwen2.5-3B-Instruct, Llama-3.2-3B-Instruct, Phi-4-mini-instruct) hasta a gran escala (Sonnet-4.5). La evaluación guiada por precisión porque los codificadores aún proporcionan cualquier diagnóstico que falte. PLM-ICD solo alcanzó un 55.8% de precisión mientras siempre presentaba 15 sugerencias. La generación solo con LLM se quedó muy atrás (1.5-34.6% de precisión) y produjo tamaños de salida inconsistentes. La auditoría agente ofreció el mejor equilibrio: los LLM compactos revisaron los 15 candidatos, descartaron evidencia débil y devolvieron de 2 a 8 códigos de alta confianza. Llama-3.2-3B-Instruct, por ejemplo, mejoró del 1.5% como generador al 55.1% como verificador mientras recortaba falsos positivos en un 73%. Estos resultados muestran que posicionar a los LLM como controladores de calidad, en lugar de generadores primarios, proporciona un apoyo confiable para los equipos de codificación clínica, mientras que la presentación formal de recall/F1 sigue siendo un trabajo futuro para implementaciones completamente autónomas.