Método de reconocimiento sensible de aprendizaje con pocas muestras basado en la red prototípica
Autores: Yuan, Guoquan; Zhao, Xinjian; Li, Liu; Zhang, Song; Wei, Shanming
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Método de reconocimiento sensible de aprendizaje con pocas muestras basado en la red prototípica
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Tradicional
Aprendizaje automático
Extracción de entidades
Redes prototipo
Reconocimiento de entidades nombradas
Modelo FSPN-NER
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Los métodos tradicionales de extracción de entidades basados en aprendizaje automático dependen en gran medida de la ingeniería de características por parte de expertos, y la capacidad de generalización del modelo es pobre. Por otro lado, las redes de prototipos pueden utilizar de manera efectiva una pequeña cantidad de datos etiquetados para entrenar modelos mientras utilizan prototipos de categorías para mejorar la capacidad de generalización de los modelos. Por lo tanto, este artículo propone un método de reconocimiento de entidades basado en redes de prototipos, a saber, el modelo FSPN-NER, para resolver el problema de reconocimiento difícil de datos sensibles en texto escaso en datos. El modelo utiliza el modelo de codificación posicional (PCM) para preentrenar los datos y realizar la extracción de características, luego calcula los vectores de prototipos para lograr la coincidencia de entidades, y finalmente introduce un módulo de detección de límites para mejorar el rendimiento de la red de prototipos en la tarea de reconocimiento de entidades nombradas. El modelo en este artículo se compara con LSTM, BiLSTM, CRF, Transformer y sus modelos de combinación, y los resultados experimentales en el conjunto de datos de prueba muestran que el modelo supera a los modelos comparativos con una precisión del 84.8%, una recuperación del 85.8% y un valor F1 de 0.853.
Descripción
Los métodos tradicionales de extracción de entidades basados en aprendizaje automático dependen en gran medida de la ingeniería de características por parte de expertos, y la capacidad de generalización del modelo es pobre. Por otro lado, las redes de prototipos pueden utilizar de manera efectiva una pequeña cantidad de datos etiquetados para entrenar modelos mientras utilizan prototipos de categorías para mejorar la capacidad de generalización de los modelos. Por lo tanto, este artículo propone un método de reconocimiento de entidades basado en redes de prototipos, a saber, el modelo FSPN-NER, para resolver el problema de reconocimiento difícil de datos sensibles en texto escaso en datos. El modelo utiliza el modelo de codificación posicional (PCM) para preentrenar los datos y realizar la extracción de características, luego calcula los vectores de prototipos para lograr la coincidencia de entidades, y finalmente introduce un módulo de detección de límites para mejorar el rendimiento de la red de prototipos en la tarea de reconocimiento de entidades nombradas. El modelo en este artículo se compara con LSTM, BiLSTM, CRF, Transformer y sus modelos de combinación, y los resultados experimentales en el conjunto de datos de prueba muestran que el modelo supera a los modelos comparativos con una precisión del 84.8%, una recuperación del 85.8% y un valor F1 de 0.853.