Clasificación de texto de sentimiento basada en aprendizaje automático para evaluar la calidad del tratamiento del resumen de alta
Autores: Waheeb, Samer Abdulateef; Ahmed Khan, Naseer; Chen, Bolin; Shang, Xuequn
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Clasificación de texto de sentimiento basada en aprendizaje automático para evaluar la calidad del tratamiento del resumen de alta
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Pacientes
Resúmenes de alta
Calidad del tratamiento
Procesamiento de lenguaje natural
Análisis de sentimientos
Registros médicos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los resúmenes de alta de los pacientes (documentos) son sensores de salud que se utilizan para medir la calidad del tratamiento en los centros médicos. Sin embargo, extraer información automáticamente de los resúmenes de alta con lenguaje natural no estructurado se considera un desafío. Este tipo de documentos incluye varios aspectos de la información del paciente que podrían utilizarse para evaluar la calidad del tratamiento y mejorar las decisiones relacionadas con la medicina. Una de las técnicas significativas en la literatura para la clasificación de resúmenes de alta son las técnicas de extracción de características del dominio del procesamiento del lenguaje natural sobre datos textuales. Proponemos un nuevo método de análisis de sentimientos para la clasificación de resúmenes de alta que se basa en modelos de espacio vectorial, métodos estadísticos, reglas de asociación y un autoencoder de máquina de aprendizaje extremo (ELM-AE). Nuestro nuevo modelo híbrido se basa en métodos estadísticos que construyen el léxico en un dominio relacionado con la salud y los registros médicos. Mientras tanto, nuestro método examina la calidad del tratamiento basado en una idea inspirada en el análisis de sentimientos. Los experimentos demuestran que nuestro método propuesto obtiene un valor F1 más alto de 0.89 con buenos valores de TPR (Tasa de Verdaderos Positivos) y FPR (Tasa de Falsos Positivos) en comparación con varios métodos de vanguardia bien conocidos con diferentes tamaños de conjuntos de datos de entrenamiento y prueba. Los resultados también demuestran que nuestro método proporciona una técnica flexible y efectiva para examinar la calidad del tratamiento basada en términos positivos, negativos y neutrales a nivel de oración en cada resumen de alta.
Descripción
Los resúmenes de alta de los pacientes (documentos) son sensores de salud que se utilizan para medir la calidad del tratamiento en los centros médicos. Sin embargo, extraer información automáticamente de los resúmenes de alta con lenguaje natural no estructurado se considera un desafío. Este tipo de documentos incluye varios aspectos de la información del paciente que podrían utilizarse para evaluar la calidad del tratamiento y mejorar las decisiones relacionadas con la medicina. Una de las técnicas significativas en la literatura para la clasificación de resúmenes de alta son las técnicas de extracción de características del dominio del procesamiento del lenguaje natural sobre datos textuales. Proponemos un nuevo método de análisis de sentimientos para la clasificación de resúmenes de alta que se basa en modelos de espacio vectorial, métodos estadísticos, reglas de asociación y un autoencoder de máquina de aprendizaje extremo (ELM-AE). Nuestro nuevo modelo híbrido se basa en métodos estadísticos que construyen el léxico en un dominio relacionado con la salud y los registros médicos. Mientras tanto, nuestro método examina la calidad del tratamiento basado en una idea inspirada en el análisis de sentimientos. Los experimentos demuestran que nuestro método propuesto obtiene un valor F1 más alto de 0.89 con buenos valores de TPR (Tasa de Verdaderos Positivos) y FPR (Tasa de Falsos Positivos) en comparación con varios métodos de vanguardia bien conocidos con diferentes tamaños de conjuntos de datos de entrenamiento y prueba. Los resultados también demuestran que nuestro método proporciona una técnica flexible y efectiva para examinar la calidad del tratamiento basada en términos positivos, negativos y neutrales a nivel de oración en cada resumen de alta.