logo móvil
Contáctanos

Ia-yolo: un modelo de segmentación vática basado en un bloque de atención invertido para cámaras de drones

Autores: Yu, Caili; Mai, Yanheng; Yang, Caijuan; Zheng, Jiaqi; Liu, Yongxin; Yu, Chaoran

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Ia-yolo: un modelo de segmentación vática basado en un bloque de atención invertido para cámaras de drones


Categoría

Ciencias Agrícolas y Biológicas

Subcategoría

Ciencias Agrícolas y Biológicas Generales

Palabras clave

Drones
Agricultura de precisión
Visión por computadora
Aprendizaje profundo
Segmentación
IA-YOLO

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 31

Citaciones: Sin citaciones


Descripción
El creciente uso de drones en la agricultura de precisión destaca la necesidad de una mayor eficiencia operativa, especialmente en el ámbito de las tareas de detección, incluso en la segmentación. Aunque la capacidad de la visión por computadora basada en aprendizaje profundo ha avanzado notablemente en los últimos diez años, la segmentación de imágenes capturadas por cámaras de Vehículos Aéreos No Tripulados (UAV), una tarea de detección exacta, aún enfrenta un conflicto entre alta precisión y baja latencia de inferencia. Debido a tal dilema, proponemos IA-YOLO (Inverted Attention You Only Look Once), un modelo eficiente basado en el Bloque IA (Inverted Attention Block) con el objetivo de proporcionar estrategias constructivas para tareas de detección en tiempo real utilizando cámaras UAV. Los detalles de funcionamiento de este documento se describen de la siguiente manera: (1) Construimos un componente llamado Bloque IA, que se integra en la estructura YOLOv8-seg como IA-YOLO. Se especializa en la clasificación a nivel de píxeles de imágenes de cámaras UAV, facilitando la creación de mapas exactos para guiar estrategias agrícolas. (2) En experimentos en el conjunto de datos Vatica, en comparación con cualquier otro modelo de segmentación ligero, IA-YOLO logra al menos un aumento del 3.3% en mAP (Promedio de Precisión Promedio). Una validación adicional en conjuntos de datos de especies diversas confirma su robusta generalización. (3) Sin sobrecargar el mecanismo de atención complejo y una red cada vez más profunda, un tallo que incorpora componentes eficientes de extracción de características, el Bloque IA, aún posee capacidades de modelado creíbles.

Otros recursos que podrían interesarte

Temas Virtualpro