Un marco basado en aprendizaje automático para recopilar y aprovechar datos web para inteligencia de amenazas cibernéticas
Autores: Koloveas, Paris; Chantzios, Thanasis; Alevizopoulou, Sofia; Skiadopoulos, Spiros; Tryfonopoulos, Christos
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Un marco basado en aprendizaje automático para recopilar y aprovechar datos web para inteligencia de amenazas cibernéticas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tecnología
Ciberamenazas
Inteligencia
Marco
Analistas de seguridad
Datos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 49
Citaciones: Sin citaciones
En el mundo actual, la tecnología se ha arraigado profundamente y es más accesible que nunca a través de una multitud de dispositivos y plataformas diferentes, que van desde servidores de empresa y PCs de consumo hasta teléfonos móviles y dispositivos portátiles, interconectando a una amplia gama de partes interesadas como hogares, organizaciones e infraestructuras críticas. El volumen y la variedad de los distintos sistemas operativos, las particularidades de los dispositivos, los diversos dominios de uso y la naturaleza accesible de las plataformas crean un vasto y complejo panorama de amenazas que es difícil de contener. Permanecer al tanto de estas amenazas cibernéticas en evolución se ha convertido en una tarea cada vez más difícil que actualmente depende en gran medida de la recopilación y utilización de inteligencia de amenazas cibernéticas antes de un ataque (o al menos poco después, para minimizar el daño) e implica la recopilación, análisis, aprovechamiento y compartición de enormes volúmenes de datos. En este trabajo, presentamos , un marco integrado basado en aprendizaje automático que proporciona una vista holística en el proceso de inteligencia de amenazas cibernéticas y permite a los analistas de seguridad identificar, recopilar, analizar, extraer, integrar y compartir fácilmente inteligencia de amenazas cibernéticas de una amplia variedad de fuentes en línea, incluidos sitios web claros/profundos/oscuros, foros y mercados, redes sociales populares, fuentes estructuradas de confianza (por ejemplo, bases de datos de seguridad conocidas) u otros tipos de almacenes de datos (por ejemplo, pastebins). es un marco integrado de código abierto y sin administración que permite a los analistas de seguridad y a las partes interesadas en seguridad (i) desplegar fácilmente una amplia variedad de servicios de adquisición de datos (como rastreadores web enfocados, raspadores de sitios, descargadores de dominios, monitores de redes sociales), (ii) clasificar automáticamente el contenido recopilado según su potencial para contener inteligencia útil, (iii) identificar y extraer inteligencia de amenazas cibernéticas y artefactos de seguridad a través de procesos automatizados de comprensión del lenguaje natural, (iv) aprovechar la inteligencia identificada para convertirla en elementos accionables mediante la desambiguación, vinculación y correlación semiautomáticas de entidades, y (v) gestionar, compartir o colaborar en la inteligencia almacenada a través de estándares abiertos y herramientas intuitivas. Hasta donde llega nuestro conocimiento, esta es la primera solución en la literatura que proporciona una plataforma de gestión de inteligencia de amenazas cibernéticas de extremo a extremo que es capaz de apoyar el ciclo de vida completo de las amenazas a través de un marco integrado, simple de usar pero extensible.
Descripción
En el mundo actual, la tecnología se ha arraigado profundamente y es más accesible que nunca a través de una multitud de dispositivos y plataformas diferentes, que van desde servidores de empresa y PCs de consumo hasta teléfonos móviles y dispositivos portátiles, interconectando a una amplia gama de partes interesadas como hogares, organizaciones e infraestructuras críticas. El volumen y la variedad de los distintos sistemas operativos, las particularidades de los dispositivos, los diversos dominios de uso y la naturaleza accesible de las plataformas crean un vasto y complejo panorama de amenazas que es difícil de contener. Permanecer al tanto de estas amenazas cibernéticas en evolución se ha convertido en una tarea cada vez más difícil que actualmente depende en gran medida de la recopilación y utilización de inteligencia de amenazas cibernéticas antes de un ataque (o al menos poco después, para minimizar el daño) e implica la recopilación, análisis, aprovechamiento y compartición de enormes volúmenes de datos. En este trabajo, presentamos , un marco integrado basado en aprendizaje automático que proporciona una vista holística en el proceso de inteligencia de amenazas cibernéticas y permite a los analistas de seguridad identificar, recopilar, analizar, extraer, integrar y compartir fácilmente inteligencia de amenazas cibernéticas de una amplia variedad de fuentes en línea, incluidos sitios web claros/profundos/oscuros, foros y mercados, redes sociales populares, fuentes estructuradas de confianza (por ejemplo, bases de datos de seguridad conocidas) u otros tipos de almacenes de datos (por ejemplo, pastebins). es un marco integrado de código abierto y sin administración que permite a los analistas de seguridad y a las partes interesadas en seguridad (i) desplegar fácilmente una amplia variedad de servicios de adquisición de datos (como rastreadores web enfocados, raspadores de sitios, descargadores de dominios, monitores de redes sociales), (ii) clasificar automáticamente el contenido recopilado según su potencial para contener inteligencia útil, (iii) identificar y extraer inteligencia de amenazas cibernéticas y artefactos de seguridad a través de procesos automatizados de comprensión del lenguaje natural, (iv) aprovechar la inteligencia identificada para convertirla en elementos accionables mediante la desambiguación, vinculación y correlación semiautomáticas de entidades, y (v) gestionar, compartir o colaborar en la inteligencia almacenada a través de estándares abiertos y herramientas intuitivas. Hasta donde llega nuestro conocimiento, esta es la primera solución en la literatura que proporciona una plataforma de gestión de inteligencia de amenazas cibernéticas de extremo a extremo que es capaz de apoyar el ciclo de vida completo de las amenazas a través de un marco integrado, simple de usar pero extensible.