Urt-yolov11: un algoritmo de campo receptivo grande para detectar la maduración del tomate bajo diferentes condiciones de campo
Autores: Mu, Di; Guou, Yuping; Wang, Wei; Peng, Ran; Guo, Chunjie; Marinello, Francesco; Xie, Yingjie; Huang, Qiang
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Urt-yolov11: un algoritmo de campo receptivo grande para detectar la maduración del tomate bajo diferentes condiciones de campo
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Modelo propuesto
Reconocimiento de tomate
Entornos agrícolas
Mejoras arquitectónicas
Bloque UniRepLKNet
Módulo RFCBAMConv
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Este estudio propone un modelo YOLOv11 mejorado para abordar las limitaciones de los algoritmos tradicionales de reconocimiento de tomates en entornos agrícolas complejos, como cambios de iluminación, oclusión, variaciones de escala y fondos complejos. Estos factores a menudo dificultan la extracción precisa de características, lo que conduce a errores de reconocimiento y a una menor eficiencia computacional. Para superar estos desafíos, el modelo integra varias mejoras arquitectónicas. Primero, el bloque UniRepLKNet reemplaza el módulo C3k2 en la red estándar, mejorando la eficiencia computacional, expandiendo el campo receptivo y mejorando el reconocimiento de objetivos a múltiples escalas. En segundo lugar, el módulo RFCBAMConv en el cuello integra mecanismos de atención de canales y espaciales, mejorando la detección de objetos pequeños y la robustez bajo condiciones de iluminación variables. Finalmente, el módulo TADDH optimiza la cabeza de detección equilibrando las tareas de clasificación y regresión a través de estrategias de alineación de tareas, mejorando aún más la precisión de detección en diferentes escalas de objetivos. Experimentos de ablación confirman la contribución de cada módulo a la mejora del rendimiento general. Nuestros resultados experimentales demuestran que el modelo propuesto exhibe una mayor estabilidad en condiciones especiales, como fondos similares, variaciones de iluminación y oclusión de objetos, al tiempo que mejora significativamente tanto la precisión como la eficiencia computacional. El modelo logra una precisión del 85.4%, una recuperación del 80.3% y de 87.3%. En comparación con el YOLOv11 de referencia, el modelo mejorado aumenta en un 2.2% mientras reduce los parámetros a 2.16 M, lo que lo hace adecuado para aplicaciones en tiempo real en entornos con recursos limitados. Este estudio proporciona una solución eficiente y práctica para la agricultura inteligente, mejorando la detección en tiempo real de tomates y sentando una base sólida para futuros sistemas de monitoreo de cultivos.
Descripción
Este estudio propone un modelo YOLOv11 mejorado para abordar las limitaciones de los algoritmos tradicionales de reconocimiento de tomates en entornos agrícolas complejos, como cambios de iluminación, oclusión, variaciones de escala y fondos complejos. Estos factores a menudo dificultan la extracción precisa de características, lo que conduce a errores de reconocimiento y a una menor eficiencia computacional. Para superar estos desafíos, el modelo integra varias mejoras arquitectónicas. Primero, el bloque UniRepLKNet reemplaza el módulo C3k2 en la red estándar, mejorando la eficiencia computacional, expandiendo el campo receptivo y mejorando el reconocimiento de objetivos a múltiples escalas. En segundo lugar, el módulo RFCBAMConv en el cuello integra mecanismos de atención de canales y espaciales, mejorando la detección de objetos pequeños y la robustez bajo condiciones de iluminación variables. Finalmente, el módulo TADDH optimiza la cabeza de detección equilibrando las tareas de clasificación y regresión a través de estrategias de alineación de tareas, mejorando aún más la precisión de detección en diferentes escalas de objetivos. Experimentos de ablación confirman la contribución de cada módulo a la mejora del rendimiento general. Nuestros resultados experimentales demuestran que el modelo propuesto exhibe una mayor estabilidad en condiciones especiales, como fondos similares, variaciones de iluminación y oclusión de objetos, al tiempo que mejora significativamente tanto la precisión como la eficiencia computacional. El modelo logra una precisión del 85.4%, una recuperación del 80.3% y de 87.3%. En comparación con el YOLOv11 de referencia, el modelo mejorado aumenta en un 2.2% mientras reduce los parámetros a 2.16 M, lo que lo hace adecuado para aplicaciones en tiempo real en entornos con recursos limitados. Este estudio proporciona una solución eficiente y práctica para la agricultura inteligente, mejorando la detección en tiempo real de tomates y sentando una base sólida para futuros sistemas de monitoreo de cultivos.