Atención basada en un modelo híbrido 1D CNN-BiLSTM mejorado con incrustación de palabras FastText para la detección de suplantación de voz en coreano
Autores: Moussavou Boussougou, Milandu Keith; Park, Dong-Joo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Atención basada en un modelo híbrido 1D CNN-BiLSTM mejorado con incrustación de palabras FastText para la detección de suplantación de voz en coreano
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Ataques de voz de suplantación
Técnicas de detección
Red neuronal artificial
Idioma coreano
Arquitectura híbrida
Mecanismos de atención
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 31
Citaciones: Sin citaciones
En el cada vez más complejo ámbito de los ataques de phishing de voz coreanos, las técnicas avanzadas de detección son primordiales. Los métodos tradicionales han logrado cierto grado de éxito. Sin embargo, a menudo no logran detectar ataques sofisticados de phishing de voz, lo que destaca la necesidad urgente de enfoques mejorados para mejorar el rendimiento de detección. Abordando esto, hemos diseñado e implementado una novedosa arquitectura de red neuronal artificial (ANN) que combina con éxito metodologías de IA centradas en datos y en modelos para detectar ataques de phishing de voz coreanos. Este documento presenta nuestra exclusiva arquitectura híbrida, que consta de una Red Neuronal Convolucional unidimensional (1D CNN), una Memoria a Corto y Largo Plazo Bidireccional (BiLSTM) y Redes de Atención Jerárquica (HANs). Nuestras evaluaciones utilizando el conjunto de datos del mundo real KorCCVi v2 demuestran que la arquitectura propuesta aprovecha de manera efectiva las fortalezas de CNN y BiLSTM para extraer y aprender características contextualmente ricas de los vectores de incrustación de palabras. Además, la implementación de mecanismos de atención de palabras y oraciones de HANs mejora el enfoque del modelo en características cruciales, mejorando considerablemente el rendimiento de detección. Alcanzando un puntaje de precisión del 99.32% y un puntaje F1 del 99.31%, nuestro modelo supera a todos los modelos base que entrenamos, supera a varias soluciones existentes y mantiene un rendimiento comparable a otros. Los hallazgos de este estudio subrayan el potencial de las arquitecturas de redes neuronales híbridas para mejorar la detección de phishing de voz en el idioma coreano y allanan el camino para investigaciones futuras. Esto podría implicar refinar y ampliar este modelo para abordar estrategias de phishing de voz cada vez más sofisticadas de manera efectiva o utilizar conjuntos de datos más grandes.
Descripción
En el cada vez más complejo ámbito de los ataques de phishing de voz coreanos, las técnicas avanzadas de detección son primordiales. Los métodos tradicionales han logrado cierto grado de éxito. Sin embargo, a menudo no logran detectar ataques sofisticados de phishing de voz, lo que destaca la necesidad urgente de enfoques mejorados para mejorar el rendimiento de detección. Abordando esto, hemos diseñado e implementado una novedosa arquitectura de red neuronal artificial (ANN) que combina con éxito metodologías de IA centradas en datos y en modelos para detectar ataques de phishing de voz coreanos. Este documento presenta nuestra exclusiva arquitectura híbrida, que consta de una Red Neuronal Convolucional unidimensional (1D CNN), una Memoria a Corto y Largo Plazo Bidireccional (BiLSTM) y Redes de Atención Jerárquica (HANs). Nuestras evaluaciones utilizando el conjunto de datos del mundo real KorCCVi v2 demuestran que la arquitectura propuesta aprovecha de manera efectiva las fortalezas de CNN y BiLSTM para extraer y aprender características contextualmente ricas de los vectores de incrustación de palabras. Además, la implementación de mecanismos de atención de palabras y oraciones de HANs mejora el enfoque del modelo en características cruciales, mejorando considerablemente el rendimiento de detección. Alcanzando un puntaje de precisión del 99.32% y un puntaje F1 del 99.31%, nuestro modelo supera a todos los modelos base que entrenamos, supera a varias soluciones existentes y mantiene un rendimiento comparable a otros. Los hallazgos de este estudio subrayan el potencial de las arquitecturas de redes neuronales híbridas para mejorar la detección de phishing de voz en el idioma coreano y allanan el camino para investigaciones futuras. Esto podría implicar refinar y ampliar este modelo para abordar estrategias de phishing de voz cada vez más sofisticadas de manera efectiva o utilizar conjuntos de datos más grandes.