Reconocimiento de entidades nombradas para diagnóstico de fallas en equipos basado en RoBERTa-wwm-ext e integración de aprendizaje profundo
Autores: Gao, Feifei; Zhang, Lin; Wang, Wenfeng; Zhang, Bo; Liu, Wei; Zhang, Jingyi; Xie, Le
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Reconocimiento de entidades nombradas para diagnóstico de fallas en equipos basado en RoBERTa-wwm-ext e integración de aprendizaje profundo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Diagnóstico de fallas en equipos
NER
Entidades
Chino
RoBERTa-wwm-ext
Aprendizaje Profundo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 48
Citaciones: Sin citaciones
El diagnóstico de fallas en equipos NER consiste en extraer entidades específicas de textos en chino sobre diagnóstico de fallas en equipos, lo cual es la premisa para construir un grafo de conocimiento de diagnóstico de fallas en equipos. El reconocimiento de entidades nombradas para el diagnóstico de fallas en equipos también puede proporcionar un importante soporte de datos para el mantenimiento de equipos. El texto de diagnóstico de fallas en equipos tiene una semántica compleja, límites de entidades difusos y un tamaño de datos limitado. Para extraer entidades del texto de diagnóstico de fallas en equipos, este artículo presenta un modelo NER para el diagnóstico de fallas en equipos basado en RoBERTa-wwm-ext e integración de redes de Aprendizaje Profundo. En primer lugar, este modelo utiliza RoBERTa-wwm-ext para extraer incrustaciones sensibles al contexto de secuencias de texto. En segundo lugar, se obtiene información de características de contexto a través de la red BiLSTM. En tercer lugar, se combina CRF para producir la secuencia de etiquetas con una relación de restricción, mejorar la precisión de la tarea de etiquetado de secuencias y completar la tarea de reconocimiento de entidades. Finalmente, se realizan experimentos y predicciones en el conjunto de datos construido. Los resultados muestran que el modelo puede identificar efectivamente cinco tipos de entidades de diagnóstico de fallas en equipos y tiene índices de evaluación más altos que el modelo tradicional. Su precisión, recall y valor F1 son del 94,57%, 95,39% y 94,98%, respectivamente. El estudio de caso demuestra que el modelo puede reconocer con precisión la entidad del texto de entrada.
Descripción
El diagnóstico de fallas en equipos NER consiste en extraer entidades específicas de textos en chino sobre diagnóstico de fallas en equipos, lo cual es la premisa para construir un grafo de conocimiento de diagnóstico de fallas en equipos. El reconocimiento de entidades nombradas para el diagnóstico de fallas en equipos también puede proporcionar un importante soporte de datos para el mantenimiento de equipos. El texto de diagnóstico de fallas en equipos tiene una semántica compleja, límites de entidades difusos y un tamaño de datos limitado. Para extraer entidades del texto de diagnóstico de fallas en equipos, este artículo presenta un modelo NER para el diagnóstico de fallas en equipos basado en RoBERTa-wwm-ext e integración de redes de Aprendizaje Profundo. En primer lugar, este modelo utiliza RoBERTa-wwm-ext para extraer incrustaciones sensibles al contexto de secuencias de texto. En segundo lugar, se obtiene información de características de contexto a través de la red BiLSTM. En tercer lugar, se combina CRF para producir la secuencia de etiquetas con una relación de restricción, mejorar la precisión de la tarea de etiquetado de secuencias y completar la tarea de reconocimiento de entidades. Finalmente, se realizan experimentos y predicciones en el conjunto de datos construido. Los resultados muestran que el modelo puede identificar efectivamente cinco tipos de entidades de diagnóstico de fallas en equipos y tiene índices de evaluación más altos que el modelo tradicional. Su precisión, recall y valor F1 son del 94,57%, 95,39% y 94,98%, respectivamente. El estudio de caso demuestra que el modelo puede reconocer con precisión la entidad del texto de entrada.