LLMs para la Ciberseguridad en la Era del Big Data: Una Revisión Integral de Aplicaciones, Desafíos y Direcciones Futuras
Autores: Karras, Aristeidis; Theodorakopoulos, Leonidas; Karras, Christos; Theodoropoulou, Alexandra; Kalliampakou, Ioanna; Kalogeratos, Gerasimos
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
LLMs para la Ciberseguridad en la Era del Big Data: Una Revisión Integral de Aplicaciones, Desafíos y Direcciones Futuras
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de lenguaje grandes
Ciberseguridad
Infraestructuras de grandes datos
Detección de amenazas
Respuesta a incidentes
Evaluación de vulnerabilidades
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este documento presenta una revisión sistemática de la investigación (2020-2025) sobre el papel de los Modelos de Lenguaje Grande (LLMs) en ciberseguridad, con énfasis en su integración en infraestructuras de Big Data. Basado en un corpus curado de 235 estudios revisados por pares, esta revisión sintetiza evidencia a través de múltiples dominios para evaluar cómo modelos como GPT-4, BERT y variantes específicas de dominio apoyan la detección de amenazas, la respuesta a incidentes, la evaluación de vulnerabilidades y la inteligencia sobre amenazas cibernéticas. Los hallazgos confirman que los LLMs, particularmente cuando se combinan con tuberías de Big Data escalables, mejoran la precisión de detección y reducen la latencia de respuesta en comparación con enfoques tradicionales. Sin embargo, persisten desafíos, incluyendo susceptibilidad a ataques adversariales, riesgos de filtración de datos, sobrecarga computacional y transparencia limitada. La contribución de este estudio radica en consolidar la investigación fragmentada en una taxonomía unificada, identificar brechas específicas del sector y delinear prioridades de investigación futuras: mejorar la robustez, mitigar sesgos, avanzar en la explicabilidad, desarrollar modelos específicos de dominio y optimizar la integración distribuida. Al hacerlo, esta revisión proporciona una base estructurada tanto para la indagación académica como para la adopción práctica de estrategias de ciberdefensa habilitadas por LLM. Última búsqueda: 30 de abril de 2025; métodos seguidos: PRISMA-2020; se evaluó el riesgo de sesgo; se realizaron síntesis de efectos aleatorios.
Descripción
Este documento presenta una revisión sistemática de la investigación (2020-2025) sobre el papel de los Modelos de Lenguaje Grande (LLMs) en ciberseguridad, con énfasis en su integración en infraestructuras de Big Data. Basado en un corpus curado de 235 estudios revisados por pares, esta revisión sintetiza evidencia a través de múltiples dominios para evaluar cómo modelos como GPT-4, BERT y variantes específicas de dominio apoyan la detección de amenazas, la respuesta a incidentes, la evaluación de vulnerabilidades y la inteligencia sobre amenazas cibernéticas. Los hallazgos confirman que los LLMs, particularmente cuando se combinan con tuberías de Big Data escalables, mejoran la precisión de detección y reducen la latencia de respuesta en comparación con enfoques tradicionales. Sin embargo, persisten desafíos, incluyendo susceptibilidad a ataques adversariales, riesgos de filtración de datos, sobrecarga computacional y transparencia limitada. La contribución de este estudio radica en consolidar la investigación fragmentada en una taxonomía unificada, identificar brechas específicas del sector y delinear prioridades de investigación futuras: mejorar la robustez, mitigar sesgos, avanzar en la explicabilidad, desarrollar modelos específicos de dominio y optimizar la integración distribuida. Al hacerlo, esta revisión proporciona una base estructurada tanto para la indagación académica como para la adopción práctica de estrategias de ciberdefensa habilitadas por LLM. Última búsqueda: 30 de abril de 2025; métodos seguidos: PRISMA-2020; se evaluó el riesgo de sesgo; se realizaron síntesis de efectos aleatorios.