Investigación sobre clasificación de texto médico basada en una red de cápsulas mejorada
Autores: Zhang, Qinghui; Yuan, Qihao; Lv, Pengtao; Zhang, Mengya; Lv, Lei
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Investigación sobre clasificación de texto médico basada en una red de cápsulas mejorada
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Campo médico
Clasificación de texto
Procesamiento de lenguaje natural
Registros médicos electrónicos chinos
Modelo de red de cápsulas
LSTM
GRU
Estructura de enrutamiento
Valor F1
Conjunto de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En el campo médico, la clasificación de textos basada en procesamiento de lenguaje natural (NLP) ha mostrado buenos resultados y tiene grandes perspectivas de aplicación práctica como valor médico clínico, pero la mayoría de las investigaciones existentes se centran en datos en inglés de registros médicos electrónicos, y hay menos investigaciones sobre la tarea de procesamiento de lenguaje natural para registros médicos electrónicos en chino. La mayoría de los registros médicos electrónicos chinos actuales son textos no institucionalizados, que generalmente tienen tasas de utilización bajas y terminología inconsistente, a menudo mezclando los síntomas de los pacientes, medicamentos, diagnósticos y otra información esencial. En este documento, proponemos un modelo de red de cápsulas para la clasificación de registros médicos electrónicos, que combina modelos LSTM y GRU y se basa en una estructura de enrutamiento única para extraer características de texto médico chino complejo. Los resultados experimentales muestran que este modelo supera a varios otros modelos de referencia y logra excelentes resultados con un valor de F1 de 73.51% en el conjunto de datos de registros médicos electrónicos chinos, al menos un 4.1% mejor que otros modelos de referencia.
Descripción
En el campo médico, la clasificación de textos basada en procesamiento de lenguaje natural (NLP) ha mostrado buenos resultados y tiene grandes perspectivas de aplicación práctica como valor médico clínico, pero la mayoría de las investigaciones existentes se centran en datos en inglés de registros médicos electrónicos, y hay menos investigaciones sobre la tarea de procesamiento de lenguaje natural para registros médicos electrónicos en chino. La mayoría de los registros médicos electrónicos chinos actuales son textos no institucionalizados, que generalmente tienen tasas de utilización bajas y terminología inconsistente, a menudo mezclando los síntomas de los pacientes, medicamentos, diagnósticos y otra información esencial. En este documento, proponemos un modelo de red de cápsulas para la clasificación de registros médicos electrónicos, que combina modelos LSTM y GRU y se basa en una estructura de enrutamiento única para extraer características de texto médico chino complejo. Los resultados experimentales muestran que este modelo supera a varios otros modelos de referencia y logra excelentes resultados con un valor de F1 de 73.51% en el conjunto de datos de registros médicos electrónicos chinos, al menos un 4.1% mejor que otros modelos de referencia.