logo móvil
Contáctanos

Un nuevo enfoque para clasificar drones utilizando una red neuronal convolucional profunda

Autores: Rakshit, Hrishi; Bagheri Zadeh, Pooneh

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Un nuevo enfoque para clasificar drones utilizando una red neuronal convolucional profunda


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Robótica

Palabras clave

Drones
Metodologías de clasificación
Técnicas de aprendizaje profundo
Conjunto de datos
Información audio-visual
Redes neuronales convolucionales

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
En los últimos años, la adaptación generalizada de los Vehículos Aéreos No Tripulados (VANT), comúnmente conocidos como drones, entre el público ha llevado a preocupaciones significativas de seguridad, lo que ha impulsado una intensa investigación en las metodologías de clasificación de drones. La clasificación rápida y precisa de los drones representa un desafío considerable debido a su pequeño tamaño y movimientos rápidos. Para abordar este desafío, este documento presenta (i) un nuevo enfoque de clasificación de drones que utiliza técnicas de aprendizaje profundo por convolución y aprendizaje profundo por transferencia. El modelo incorpora conexiones de bypass y funciones de activación Leaky ReLU para mitigar el "problema del gradiente que desaparece" y el "problema de ReLU que muere", respectivamente, asociados con redes profundas y se entrena en un conjunto de datos diverso. Este estudio emplea (ii) un conjunto de datos personalizado que comprende tanto datos de audio como visuales de drones, así como objetos análogos como un avión, aves, un helicóptero, etc., para mejorar la precisión de la clasificación. La integración de información audiovisual facilita una clasificación de drones más precisa. Además, (iii) se propone un nuevo filtro de respuesta finita (FIR) de paso bajo para convertir señales de audio en imágenes de espectrograma, reduciendo la susceptibilidad al ruido y la interferencia. El modelo propuesto representa un avance transformador en el diseño de redes neuronales convolucionales, ilustrando la compatibilidad de eficacia y eficiencia sin comprometer la complejidad y las propiedades aprendibles. Se demostró un rendimiento notable por parte del modelo propuesto, con una precisión del 100% alcanzada en las imágenes de prueba utilizando solo cuatro millones de parámetros aprendibles. En contraste, los modelos Resnet50 e Inception-V3 exhiben una precisión del 90% cada uno en el mismo conjunto de prueba, a pesar del uso de 23.50 millones y 21.80 millones de parámetros aprendibles, respectivamente.

Otros recursos que podrían interesarte

Temas Virtualpro