UAVThreatBench: Un conjunto de datos de evaluación de riesgos de ciberseguridad de UAV y evaluación empírica de LLMs para la identificación de amenazas

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

UAVThreatBench: Un conjunto de datos de evaluación de riesgos de ciberseguridad de UAV y evaluación empírica de LLMs para la identificación de amenazas

Autores: Iyenghar, Padma

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico

2025

UAVThreatBench: Un conjunto de datos de evaluación de riesgos de ciberseguridad de UAV y evaluación empírica de LLMs para la identificación de amenazas

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Modelos de lenguaje grandes

Amenazas a la ciberseguridad

Vehículos aéreos no tripulados

Escenarios industriales

Artículos directivos

Conjunto de datos de referencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

UAVThreatBench presenta el primer benchmark estructurado para evaluar modelos de lenguaje grandes en la identificación de amenazas cibernéticas para vehículos aéreos no tripulados que operan en entornos industriales interiores, alineado con la Directiva Europea de Equipos de Radio. El benchmark consta de 924 escenarios industriales curados por expertos, cada uno anotado con cinco amenazas cibernéticas, lo que da un total de 4620 amenazas mapeadas a artículos de la directiva sobre la integridad de redes y dispositivos, la protección de datos personales y la privacidad, y la prevención del fraude y el daño económico. Siete modelos de vanguardia de la familia OpenAI GPT y la familia LLaMA fueron evaluados sistemáticamente en un subconjunto representativo de 100 escenarios del conjunto de datos de UAVThreatBench. La evaluación aplicó un umbral de coincidencia difusa de 70 para comparar las amenazas generadas por el modelo con la verdad de referencia definida por expertos. El modelo más fuerte identificó correctamente casi nueve de cada diez amenazas, con cerca de la mitad de los escenarios logrando una alineación perfecta, mientras que otros modelos lograron una alineación menor pero aún sustancial. El análisis de errores semánticos reveló debilidades sistemáticas, particularmente en la identificación de amenazas relacionadas con la disponibilidad, vulnerabilidades en la capa de backend y mapeos regulatorios a nivel de cláusula. Por lo tanto, UAVThreatBench establece una base reproducible para la identificación de amenazas cibernéticas conforme a la normativa en entornos de vehículos aéreos no tripulados críticos para la seguridad. El conjunto de datos completo del benchmark y los resultados de la evaluación se publican abiertamente bajo la licencia MIT a través de un repositorio en línea dedicado.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro