Modelo de Aprendizaje Multi-Tarea Orientado a QA Médica para la Clasificación de Intención de Preguntas y el Reconocimiento de Entidades Nombradas
Autores: Tohti, Turdi; Abdurxit, Mamatjan; Hamdulla, Askar
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Modelo de Aprendizaje Multi-Tarea Orientado a QA Médica para la Clasificación de Intención de Preguntas y el Reconocimiento de Entidades Nombradas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Clasificación de intenciones
Reconocimiento de entidades nombradas
Preguntas médicas
Modelo de aprendizaje multitarea
ALBERT-BILSTM
En línea en chino
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La clasificación de intenciones y el reconocimiento de entidades nombradas de preguntas médicas son dos subtareas clave del módulo de comprensión del lenguaje natural en el sistema de respuesta a preguntas. La mayoría de los métodos existentes suelen tratar la clasificación de intenciones de consultas médicas y el reconocimiento de entidades nombradas como dos tareas separadas, ignorando la estrecha relación entre ambas. Con el fin de optimizar el efecto de la clasificación de intenciones de consultas médicas y las tareas de reconocimiento de entidades nombradas, se propone un modelo de aprendizaje multitarea basado en ALBERT-BILSTM para la clasificación de intenciones y el reconocimiento de entidades nombradas de preguntas médicas en línea en chino. El modelo de aprendizaje multitarea en este artículo utiliza el intercambio de parámetros del codificador, lo que permite que la red subyacente del modelo tenga en cuenta tanto las características del reconocimiento de entidades nombradas como las de la clasificación de intenciones. El modelo aprende la información compartida entre las dos tareas mientras mantiene sus características únicas durante la fase de decodificación. Se utiliza el modelo de lenguaje de preentrenamiento ALBERT para obtener vectores de palabras que contienen información semántica y se utiliza la red LSTM bidireccional para el entrenamiento. Se realizó un experimento comparativo de diferentes modelos en un conjunto de datos de preguntas médicas en chino. Los resultados experimentales muestran que el método de aprendizaje multitarea propuesto supera al método de referencia en términos de precisión, recuperación y valor F1. En comparación con el modelo de tarea única, se ha mejorado la capacidad de generalización del modelo.
Descripción
La clasificación de intenciones y el reconocimiento de entidades nombradas de preguntas médicas son dos subtareas clave del módulo de comprensión del lenguaje natural en el sistema de respuesta a preguntas. La mayoría de los métodos existentes suelen tratar la clasificación de intenciones de consultas médicas y el reconocimiento de entidades nombradas como dos tareas separadas, ignorando la estrecha relación entre ambas. Con el fin de optimizar el efecto de la clasificación de intenciones de consultas médicas y las tareas de reconocimiento de entidades nombradas, se propone un modelo de aprendizaje multitarea basado en ALBERT-BILSTM para la clasificación de intenciones y el reconocimiento de entidades nombradas de preguntas médicas en línea en chino. El modelo de aprendizaje multitarea en este artículo utiliza el intercambio de parámetros del codificador, lo que permite que la red subyacente del modelo tenga en cuenta tanto las características del reconocimiento de entidades nombradas como las de la clasificación de intenciones. El modelo aprende la información compartida entre las dos tareas mientras mantiene sus características únicas durante la fase de decodificación. Se utiliza el modelo de lenguaje de preentrenamiento ALBERT para obtener vectores de palabras que contienen información semántica y se utiliza la red LSTM bidireccional para el entrenamiento. Se realizó un experimento comparativo de diferentes modelos en un conjunto de datos de preguntas médicas en chino. Los resultados experimentales muestran que el método de aprendizaje multitarea propuesto supera al método de referencia en términos de precisión, recuperación y valor F1. En comparación con el modelo de tarea única, se ha mejorado la capacidad de generalización del modelo.