Modelado Semántico de Temas de Informes de Seguridad Aérea: Un Análisis Comparativo Usando BERTopic y PLSA
Autores: Nanyonga, Aziida; Joiner, Keith; Turhan, Ugur; Wild, Graham
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Modelado Semántico de Temas de Informes de Seguridad Aérea: Un Análisis Comparativo Usando BERTopic y PLSA
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Aeroespacial
Palabras clave
Seguridad en la aviación
Informes narrativos de incidentes
Técnicas de modelado de temas
PLSA
BERTopic
Procesamiento de lenguaje natural
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 42
Citaciones: Sin citaciones
El análisis de seguridad en la aviación depende cada vez más de la extracción de información útil de informes narrativos de incidentes para apoyar la identificación de riesgos y mejorar la seguridad operativa. Las técnicas de modelado de temas, como el Análisis Semántico Latente Probabilístico (pLSA) y BERTopic, ofrecen métodos automatizados para descubrir temas latentes en narrativas de seguridad no estructuradas. Este estudio evalúa la efectividad de cada modelo en la generación de temas coherentes, interpretables y semánticamente significativos para los profesionales e investigadores de la seguridad en la aviación. Evaluamos el rendimiento del modelo utilizando tanto métricas cuantitativas (puntuaciones de coherencia de temas) como evaluaciones cualitativas de la relevancia de los temas. Los hallazgos muestran que, si bien pLSA proporciona un sólido marco probabilístico, BERTopic, aprovechando incrustaciones basadas en transformadores y agrupamiento HDBSCAN, produce agrupaciones de temas más matizadas y conscientes del contexto, aunque con mayores demandas computacionales y complejidad de ajuste. Estos resultados destacan las respectivas fortalezas y compensaciones de los enfoques tradicionales frente a los modernos en el modelado de temas en el análisis de seguridad en la aviación. Este trabajo avanza en la aplicación del procesamiento de lenguaje natural (NLP) en la aviación al demostrar cómo el modelado de temas puede apoyar la evaluación de riesgos, informar políticas y mejorar los resultados de seguridad.
Descripción
El análisis de seguridad en la aviación depende cada vez más de la extracción de información útil de informes narrativos de incidentes para apoyar la identificación de riesgos y mejorar la seguridad operativa. Las técnicas de modelado de temas, como el Análisis Semántico Latente Probabilístico (pLSA) y BERTopic, ofrecen métodos automatizados para descubrir temas latentes en narrativas de seguridad no estructuradas. Este estudio evalúa la efectividad de cada modelo en la generación de temas coherentes, interpretables y semánticamente significativos para los profesionales e investigadores de la seguridad en la aviación. Evaluamos el rendimiento del modelo utilizando tanto métricas cuantitativas (puntuaciones de coherencia de temas) como evaluaciones cualitativas de la relevancia de los temas. Los hallazgos muestran que, si bien pLSA proporciona un sólido marco probabilístico, BERTopic, aprovechando incrustaciones basadas en transformadores y agrupamiento HDBSCAN, produce agrupaciones de temas más matizadas y conscientes del contexto, aunque con mayores demandas computacionales y complejidad de ajuste. Estos resultados destacan las respectivas fortalezas y compensaciones de los enfoques tradicionales frente a los modernos en el modelado de temas en el análisis de seguridad en la aviación. Este trabajo avanza en la aplicación del procesamiento de lenguaje natural (NLP) en la aviación al demostrar cómo el modelado de temas puede apoyar la evaluación de riesgos, informar políticas y mejorar los resultados de seguridad.