logo móvil
Contáctanos

DFA-YOLO: Un nuevo modelo YOLO para el reconocimiento de violaciones en la operación de energía eléctrica

Autores: Qian, Xiaoliang; Ding, Xinyu; Wang, Pengfei; Guo, Jungang; Chen, Hu; Wang, Wei; Xing, Peixu

Idioma: Inglés

Editor: MDPI

Año: 2025

Descargar PDF

Acceso abierto

Artículo científico
2025

DFA-YOLO: Un nuevo modelo YOLO para el reconocimiento de violaciones en la operación de energía eléctrica


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Yolo
Detección de objetos
Limitaciones
Dfa-yolo
Objetos a múltiples escalas
Inferencia en tiempo real

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La serie de modelos You Only Look Once (YOLO), particularmente el modelo YOLOv12 recientemente introducido, ha demostrado un potencial significativo para lograr un reconocimiento preciso y rápido de violaciones en la operación de energía eléctrica, debido a sus ventajas integrales en precisión de detección e inferencia en tiempo real. Sin embargo, los modelos YOLO actuales aún tienen tres limitaciones: (1) la ausencia de una extracción de características dedicada para objetos de múltiples escalas, lo que resulta en capacidades de detección subóptimas para objetos de diferentes tamaños; (2) la integración ingenua de atenciones espaciales y de canal, que restringe la mejora de la discriminabilidad de características y, en consecuencia, perjudica el rendimiento de detección para objetos desafiantes en fondos complejos; y (3) una débil capacidad de representación en características de bajo nivel, lo que lleva a una precisión insuficiente para objetos de pequeño tamaño. Para abordar estas limitaciones, se propone un nuevo modelo YOLO llamado DFA-YOLO, un modelo de detección de objetos en tiempo real con YOLOv12n como su base, que realiza tres contribuciones clave. En primer lugar, se propone un módulo de convolución multi-escala ponderada dinámica (DWMConv) para abordar la primera limitación, que emplea convolución multi-escala ligera seguida de fusión ponderada aprendible para mejorar la representación de características para objetos de múltiples escalas. En segundo lugar, se propone un módulo de atención de dimensión completa (FDA) para abordar la segunda limitación, que proporciona un esquema de cálculo de atención unificado que integra efectivamente la atención a través de las dimensiones de altura, ancho y canal, mejorando así la discriminabilidad de características. En tercer lugar, se introduce un conjunto de cabezales de detección auxiliares (Aux-Heads) para abordar la tercera limitación e insertarlos en la red base para fortalecer el efecto de entrenamiento de las etiquetas en el módulo de extracción de características de bajo nivel. Los estudios de ablación en el conjunto de datos EPOVR-v1.0 demuestran la validez del módulo DWMConv propuesto, el módulo FDA, los Aux-Heads y su integración sinérgica. En relación con el modelo base, DFA-YOLO logra mejoras significativas en mAP@0.5 y mAP@0.5-0.95, en un 3.15% y un 4.13%, respectivamente, mientras reduce parámetros y GFLOPS en 0.06M y 0.06, respectivamente, y aumenta FPS en 3.52. Comparaciones cuantitativas completas con nueve modelos oficiales de YOLO, incluyendo YOLOv13n, confirman que DFA-YOLO logra un rendimiento superior tanto en precisión de detección como en inferencia en tiempo real, validando aún más la efectividad del modelo DFA-YOLO.

Otros recursos que podrían interesarte

Temas Virtualpro