Un nuevo enfoque para clasificar drones utilizando una red neuronal convolucional profunda
Autores: Rakshit, Hrishi; Bagheri Zadeh, Pooneh
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un nuevo enfoque para clasificar drones utilizando una red neuronal convolucional profunda
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Robótica
Palabras clave
Drones
Metodologías de clasificación
Técnicas de aprendizaje profundo
Conjunto de datos
Información audio-visual
Redes neuronales convolucionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En los últimos años, la adaptación generalizada de los Vehículos Aéreos No Tripulados (VANT), comúnmente conocidos como drones, entre el público ha llevado a preocupaciones significativas de seguridad, lo que ha impulsado una intensa investigación en las metodologías de clasificación de drones. La clasificación rápida y precisa de los drones representa un desafío considerable debido a su pequeño tamaño y movimientos rápidos. Para abordar este desafío, este documento presenta (i) un nuevo enfoque de clasificación de drones que utiliza técnicas de aprendizaje profundo por convolución y aprendizaje profundo por transferencia. El modelo incorpora conexiones de bypass y funciones de activación Leaky ReLU para mitigar el "problema del gradiente que desaparece" y el "problema de ReLU que muere", respectivamente, asociados con redes profundas y se entrena en un conjunto de datos diverso. Este estudio emplea (ii) un conjunto de datos personalizado que comprende tanto datos de audio como visuales de drones, así como objetos análogos como un avión, aves, un helicóptero, etc., para mejorar la precisión de la clasificación. La integración de información audiovisual facilita una clasificación de drones más precisa. Además, (iii) se propone un nuevo filtro de respuesta finita (FIR) de paso bajo para convertir señales de audio en imágenes de espectrograma, reduciendo la susceptibilidad al ruido y la interferencia. El modelo propuesto representa un avance transformador en el diseño de redes neuronales convolucionales, ilustrando la compatibilidad de eficacia y eficiencia sin comprometer la complejidad y las propiedades aprendibles. Se demostró un rendimiento notable por parte del modelo propuesto, con una precisión del 100% alcanzada en las imágenes de prueba utilizando solo cuatro millones de parámetros aprendibles. En contraste, los modelos Resnet50 e Inception-V3 exhiben una precisión del 90% cada uno en el mismo conjunto de prueba, a pesar del uso de 23.50 millones y 21.80 millones de parámetros aprendibles, respectivamente.
Descripción
En los últimos años, la adaptación generalizada de los Vehículos Aéreos No Tripulados (VANT), comúnmente conocidos como drones, entre el público ha llevado a preocupaciones significativas de seguridad, lo que ha impulsado una intensa investigación en las metodologías de clasificación de drones. La clasificación rápida y precisa de los drones representa un desafío considerable debido a su pequeño tamaño y movimientos rápidos. Para abordar este desafío, este documento presenta (i) un nuevo enfoque de clasificación de drones que utiliza técnicas de aprendizaje profundo por convolución y aprendizaje profundo por transferencia. El modelo incorpora conexiones de bypass y funciones de activación Leaky ReLU para mitigar el "problema del gradiente que desaparece" y el "problema de ReLU que muere", respectivamente, asociados con redes profundas y se entrena en un conjunto de datos diverso. Este estudio emplea (ii) un conjunto de datos personalizado que comprende tanto datos de audio como visuales de drones, así como objetos análogos como un avión, aves, un helicóptero, etc., para mejorar la precisión de la clasificación. La integración de información audiovisual facilita una clasificación de drones más precisa. Además, (iii) se propone un nuevo filtro de respuesta finita (FIR) de paso bajo para convertir señales de audio en imágenes de espectrograma, reduciendo la susceptibilidad al ruido y la interferencia. El modelo propuesto representa un avance transformador en el diseño de redes neuronales convolucionales, ilustrando la compatibilidad de eficacia y eficiencia sin comprometer la complejidad y las propiedades aprendibles. Se demostró un rendimiento notable por parte del modelo propuesto, con una precisión del 100% alcanzada en las imágenes de prueba utilizando solo cuatro millones de parámetros aprendibles. En contraste, los modelos Resnet50 e Inception-V3 exhiben una precisión del 90% cada uno en el mismo conjunto de prueba, a pesar del uso de 23.50 millones y 21.80 millones de parámetros aprendibles, respectivamente.