Forense de Accidentes de UAV a través del Razonamiento HFACS-LLM: Perspectivas de Seguridad a Baja Altitud
Autores: Yan, Yuqi; Li, Boyang; Lodewijks, Gabriel
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Forense de Accidentes de UAV a través del Razonamiento HFACS-LLM: Perspectivas de Seguridad a Baja Altitud
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Investigación de accidentes de UAV
Factores humanos
Modelos de lenguaje grandes
Hfacs
Análisis automatizado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La investigación de accidentes de UAV es esencial para salvaguardar el espacio aéreo de baja altitud en rápido crecimiento. Aunque se reportan incidentes casi a diario, rara vez se analizan en profundidad, ya que las investigaciones actuales dependen de expertos y son lentas. Dado que la mayoría de las jurisdicciones exigen informes formales solo para lesiones graves o daños materiales sustanciales, una gran proporción de ocurrencias menores no recibe una investigación sistemática, lo que resulta en brechas de datos persistentes y obstaculiza la gestión proactiva de riesgos. Este estudio explora el potencial de utilizar modelos de lenguaje grandes (LLMs) para acelerar las investigaciones de accidentes de UAV al extraer información sobre factores humanos de informes de incidentes narrativos no estructurados. A pesar de su promesa, los LLMs disponibles aún luchan con el razonamiento específico del dominio en el contexto de UAV. Para abordar esto, desarrollamos un marco analítico guiado por un sistema de análisis y clasificación de factores humanos (HFACS), que combina un prompting estructurado con un post-procesamiento ligero. Este marco guía sistemáticamente al modelo a través de un procedimiento de dos etapas para inferir los actos inseguros de los operadores, sus precondiciones latentes y las influencias organizacionales y factores de riesgo regulatorios asociados. Se ha compilado un corpus de accidentes de UAV etiquetado con HFACS que comprende 200 informes de eventos anormales con 3600 instancias codificadas para apoyar la evaluación. A través de siete LLMs y 18 categorías de HFACS, el macro-F1 varió entre 0.58 y 0.76; nuestra mejor configuración logró un macro-F1 de 0.76 (precisión 0.71, recuperación 0.82), con precisiones de categoría representativas superiores al 93%. Las evaluaciones comparativas indican que el LLM con prompting puede igualar, y en ciertas tareas superar, a los expertos humanos. Los hallazgos destacan la promesa del análisis automatizado de factores humanos para llevar a cabo investigaciones rápidas y sistemáticas de accidentes de UAV.
Descripción
La investigación de accidentes de UAV es esencial para salvaguardar el espacio aéreo de baja altitud en rápido crecimiento. Aunque se reportan incidentes casi a diario, rara vez se analizan en profundidad, ya que las investigaciones actuales dependen de expertos y son lentas. Dado que la mayoría de las jurisdicciones exigen informes formales solo para lesiones graves o daños materiales sustanciales, una gran proporción de ocurrencias menores no recibe una investigación sistemática, lo que resulta en brechas de datos persistentes y obstaculiza la gestión proactiva de riesgos. Este estudio explora el potencial de utilizar modelos de lenguaje grandes (LLMs) para acelerar las investigaciones de accidentes de UAV al extraer información sobre factores humanos de informes de incidentes narrativos no estructurados. A pesar de su promesa, los LLMs disponibles aún luchan con el razonamiento específico del dominio en el contexto de UAV. Para abordar esto, desarrollamos un marco analítico guiado por un sistema de análisis y clasificación de factores humanos (HFACS), que combina un prompting estructurado con un post-procesamiento ligero. Este marco guía sistemáticamente al modelo a través de un procedimiento de dos etapas para inferir los actos inseguros de los operadores, sus precondiciones latentes y las influencias organizacionales y factores de riesgo regulatorios asociados. Se ha compilado un corpus de accidentes de UAV etiquetado con HFACS que comprende 200 informes de eventos anormales con 3600 instancias codificadas para apoyar la evaluación. A través de siete LLMs y 18 categorías de HFACS, el macro-F1 varió entre 0.58 y 0.76; nuestra mejor configuración logró un macro-F1 de 0.76 (precisión 0.71, recuperación 0.82), con precisiones de categoría representativas superiores al 93%. Las evaluaciones comparativas indican que el LLM con prompting puede igualar, y en ciertas tareas superar, a los expertos humanos. Los hallazgos destacan la promesa del análisis automatizado de factores humanos para llevar a cabo investigaciones rápidas y sistemáticas de accidentes de UAV.