Aviación-BERT-NER: Reconocimiento de Entidades Nombradas para Informes de Seguridad en Aviación
Autores: Chandra, Chetan; Ojima, Yuga; Bendarkar, Mayank V.; Mavris, Dimitri N.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Aviación-BERT-NER: Reconocimiento de Entidades Nombradas para Informes de Seguridad en Aviación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Aviación
Bert
Ner
Informes de seguridad
Específicos del dominio
Entidades
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 16
Citaciones: Sin citaciones
Este trabajo presenta Aviation-BERT-NER, un sistema de Reconocimiento de Entidades Nombradas (NER) diseñado para informes de seguridad en aviación, basado en el modelo base Aviation-BERT desarrollado en el Laboratorio de Diseño de Sistemas Aeroespaciales del Instituto Tecnológico de Georgia. Este sistema integra datos específicos del dominio de la aviación, incluidos tipos de aeronaves, fabricantes, cantidades y terminología de aviación, para identificar entidades nombradas críticas para el análisis de seguridad en aviación. Una innovación clave de Aviation-BERT-NER es su enfoque basado en plantillas para el ajuste fino, que utiliza conjuntos de datos estructurados para generar datos de entrenamiento sintéticos que reflejan la complejidad de los informes de seguridad en aviación del mundo real. Este método mejora significativamente la generalizabilidad y adaptabilidad del modelo, permitiendo actualizaciones rápidas y personalización para satisfacer los requisitos específicos del dominio en evolución. El proceso de desarrollo involucró una cuidadosa preparación de datos, incluida la síntesis de tipos de entidades y la generación de conjuntos de datos etiquetados a través del llenado de plantillas. Las pruebas en narrativas del mundo real de la base de datos de la Junta Nacional de Seguridad en el Transporte (NTSB) destacaron la robustez de Aviation-BERT-NER, con una precisión del 95.34%, un recall del 94.62% y un puntaje F1 del 94.78% cuando se evaluó sobre 50 párrafos anotados manualmente (etiquetados BIO). Este trabajo aborda una brecha crítica en los modelos NER en inglés para la seguridad en aviación, prometiendo mejoras sustanciales en el análisis y comprensión de los informes de seguridad en aviación.
Descripción
Este trabajo presenta Aviation-BERT-NER, un sistema de Reconocimiento de Entidades Nombradas (NER) diseñado para informes de seguridad en aviación, basado en el modelo base Aviation-BERT desarrollado en el Laboratorio de Diseño de Sistemas Aeroespaciales del Instituto Tecnológico de Georgia. Este sistema integra datos específicos del dominio de la aviación, incluidos tipos de aeronaves, fabricantes, cantidades y terminología de aviación, para identificar entidades nombradas críticas para el análisis de seguridad en aviación. Una innovación clave de Aviation-BERT-NER es su enfoque basado en plantillas para el ajuste fino, que utiliza conjuntos de datos estructurados para generar datos de entrenamiento sintéticos que reflejan la complejidad de los informes de seguridad en aviación del mundo real. Este método mejora significativamente la generalizabilidad y adaptabilidad del modelo, permitiendo actualizaciones rápidas y personalización para satisfacer los requisitos específicos del dominio en evolución. El proceso de desarrollo involucró una cuidadosa preparación de datos, incluida la síntesis de tipos de entidades y la generación de conjuntos de datos etiquetados a través del llenado de plantillas. Las pruebas en narrativas del mundo real de la base de datos de la Junta Nacional de Seguridad en el Transporte (NTSB) destacaron la robustez de Aviation-BERT-NER, con una precisión del 95.34%, un recall del 94.62% y un puntaje F1 del 94.78% cuando se evaluó sobre 50 párrafos anotados manualmente (etiquetados BIO). Este trabajo aborda una brecha crítica en los modelos NER en inglés para la seguridad en aviación, prometiendo mejoras sustanciales en el análisis y comprensión de los informes de seguridad en aviación.