Aprendizaje Automático y Procesamiento de Lenguaje Natural para la Predicción de Factores Humanos en Informes de Incidentes de Aviación
Autores: Madeira, Tomás; Melício, Rui; Valério, Duarte; Santos, Luis
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Aprendizaje Automático y Procesamiento de Lenguaje Natural para la Predicción de Factores Humanos en Informes de Incidentes de Aviación
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Sector de la aviación
Factores humanos
Incidentes de seguridad
Sistemas de predicción
Procesamiento de Lenguaje Natural
Modelado de datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En el sector de la aviación, los factores humanos son la causa principal de incidentes de seguridad. Se han desarrollado sistemas de predicción inteligentes, capaces de evaluar el estado humano y gestionar el riesgo, a lo largo de los años para identificar y prevenir factores humanos. Sin embargo, la falta de grandes conjuntos de datos etiquetados útiles ha sido a menudo un obstáculo para el desarrollo de estos sistemas. Este estudio presenta una metodología para identificar y clasificar categorías de factores humanos a partir de informes de incidentes de aviación. Para la extracción de características, se desarrolla un proceso de preprocesamiento de texto y una pipeline de Procesamiento de Lenguaje Natural (NLP). Para la modelización de datos, se consideran técnicas de propagación de etiquetas semisupervisada (LS) y máquinas de soporte vectorial supervisadas (SVM). Se aplican métodos de búsqueda aleatoria y optimización bayesiana para el análisis de hiperparámetros y la mejora del rendimiento del modelo, medido por la puntuación Micro F1. Los mejores modelos predictivos lograron una puntuación Micro F1 de 0.900, 0.779 y 0.875, para cada nivel del marco taxonómico, respectivamente. Los resultados del método propuesto indican que se pueden lograr rendimientos predictivos favorables para la clasificación de factores humanos basados en datos de texto. No obstante, se recomendaría un conjunto de datos más grande en futuras investigaciones.
Descripción
En el sector de la aviación, los factores humanos son la causa principal de incidentes de seguridad. Se han desarrollado sistemas de predicción inteligentes, capaces de evaluar el estado humano y gestionar el riesgo, a lo largo de los años para identificar y prevenir factores humanos. Sin embargo, la falta de grandes conjuntos de datos etiquetados útiles ha sido a menudo un obstáculo para el desarrollo de estos sistemas. Este estudio presenta una metodología para identificar y clasificar categorías de factores humanos a partir de informes de incidentes de aviación. Para la extracción de características, se desarrolla un proceso de preprocesamiento de texto y una pipeline de Procesamiento de Lenguaje Natural (NLP). Para la modelización de datos, se consideran técnicas de propagación de etiquetas semisupervisada (LS) y máquinas de soporte vectorial supervisadas (SVM). Se aplican métodos de búsqueda aleatoria y optimización bayesiana para el análisis de hiperparámetros y la mejora del rendimiento del modelo, medido por la puntuación Micro F1. Los mejores modelos predictivos lograron una puntuación Micro F1 de 0.900, 0.779 y 0.875, para cada nivel del marco taxonómico, respectivamente. Los resultados del método propuesto indican que se pueden lograr rendimientos predictivos favorables para la clasificación de factores humanos basados en datos de texto. No obstante, se recomendaría un conjunto de datos más grande en futuras investigaciones.