logo móvil
Contáctanos

Integrando Inteligencia Artificial Agente para Automatizar la Clasificación Internacional de Enfermedades, Décima Revisión, Codificación Médica

Autores: Akkhawatthanakun, Kitti; Narupiyakul, Lalita; Wongpatikaseree, Konlakorn; Hnoohom, Narit; Termritthikun, Chakkrit; Muneesawang, Paisarn

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Integrando Inteligencia Artificial Agente para Automatizar la Clasificación Internacional de Enfermedades, Décima Revisión, Codificación Médica


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Automatización
Codificación ICD-10
Resúmenes de alta
Sistema de aprendizaje profundo
Narrativas clínicas
Enfoque híbrido

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La automatización de la codificación ICD-10 a partir de resúmenes de alta sigue siendo exigente porque los codificadores analizan narrativas clínicas mientras justifican decisiones. Este estudio compara tres patrones de automatización: PLM-ICD como un sistema de aprendizaje profundo independiente que emite 15 códigos por caso, generación solo con LLM con plena autonomía, y un enfoque híbrido donde PLM-ICD elabora candidatos para una auditoría de LLM agente que acepta o rechaza. Todas las estrategias se evaluaron en 19,801 resúmenes de MIMIC-IV utilizando cuatro LLM que abarcan desde compactos (Qwen2.5-3B-Instruct, Llama-3.2-3B-Instruct, Phi-4-mini-instruct) hasta a gran escala (Sonnet-4.5). La evaluación guiada por precisión porque los codificadores aún proporcionan cualquier diagnóstico que falte. PLM-ICD solo alcanzó un 55.8% de precisión mientras siempre presentaba 15 sugerencias. La generación solo con LLM se quedó muy atrás (1.5-34.6% de precisión) y produjo tamaños de salida inconsistentes. La auditoría agente ofreció el mejor equilibrio: los LLM compactos revisaron los 15 candidatos, descartaron evidencia débil y devolvieron de 2 a 8 códigos de alta confianza. Llama-3.2-3B-Instruct, por ejemplo, mejoró del 1.5% como generador al 55.1% como verificador mientras recortaba falsos positivos en un 73%. Estos resultados muestran que posicionar a los LLM como controladores de calidad, en lugar de generadores primarios, proporciona un apoyo confiable para los equipos de codificación clínica, mientras que la presentación formal de recall/F1 sigue siendo un trabajo futuro para implementaciones completamente autónomas.

Otros recursos que podrían interesarte

Temas Virtualpro