Método de Segmentación de Objetivos de Ganado en Múltiples Escenas Usando el Método Mejorado DeepLabV3+
Autores: Feng, Tao; Guo, Yangyang; Huang, Xiaoping; Qiao, Yongliang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Método de Segmentación de Objetivos de Ganado en Múltiples Escenas Usando el Método Mejorado DeepLabV3+
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Regiones animales
Relación de posición relativa
Agricultura inteligente de animales
Modelo de segmentación semántica
Red DeepLabV3+
Imp-DeepLabV3+
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 11
Citaciones: Sin citaciones
Obtener las regiones de los animales y la relación de posición relativa de los animales en la escena es beneficioso para estudiar más a fondo los hábitos de los animales, lo cual es de gran importancia para la ganadería inteligente. Sin embargo, el complejo entorno de cría sigue dificultando la detección. Para abordar los problemas de los pobres efectos de segmentación de objetivos y la débil capacidad de generalización de los modelos de segmentación semántica existentes en escenas complejas, se propuso un modelo de segmentación semántica basado en una red mejorada DeepLabV3+ (Imp-DeepLabV3+). En primer lugar, se reemplazó la red de respaldo del modelo DeepLabV3+ por MobileNetV2 para mejorar la capacidad de extracción de características del modelo. Luego, se adoptó el método de fusión de características capa por capa en la etapa del Decodificador para integrar la información de características semánticas de alto nivel con la información de características de alta resolución de bajo nivel a múltiples escalas para lograr una operación de sobremuestreo más precisa. Finalmente, se introdujo el módulo SENet en la red para mejorar la interacción de la información después de la fusión de características y mejorar la precisión de segmentación del modelo en conjuntos de datos complejos. Los resultados experimentales demuestran que el modelo Imp-DeepLabV3+ logró una alta precisión de píxeles del 99.4%, una precisión media de píxeles del 98.1% y una intersección media sobre la unión del 96.8%. En comparación con el modelo original DeepLabV3+, el rendimiento de segmentación del modelo mejorado mejoró significativamente. Además, el rendimiento general de segmentación del modelo Imp-DeepLabV3+ superó al de otros modelos de segmentación semántica comúnmente utilizados, como las Redes Neuronales Convolucionales Completas (FCNs), el Pooling Piramidal Espacial Atronado Reducido (LR-ASPP) y U-Net. Por lo tanto, este estudio puede aplicarse al campo de la segmentación de escenas y es beneficioso para analizar más a fondo la información individual y promover el desarrollo de la ganadería inteligente.
Descripción
Obtener las regiones de los animales y la relación de posición relativa de los animales en la escena es beneficioso para estudiar más a fondo los hábitos de los animales, lo cual es de gran importancia para la ganadería inteligente. Sin embargo, el complejo entorno de cría sigue dificultando la detección. Para abordar los problemas de los pobres efectos de segmentación de objetivos y la débil capacidad de generalización de los modelos de segmentación semántica existentes en escenas complejas, se propuso un modelo de segmentación semántica basado en una red mejorada DeepLabV3+ (Imp-DeepLabV3+). En primer lugar, se reemplazó la red de respaldo del modelo DeepLabV3+ por MobileNetV2 para mejorar la capacidad de extracción de características del modelo. Luego, se adoptó el método de fusión de características capa por capa en la etapa del Decodificador para integrar la información de características semánticas de alto nivel con la información de características de alta resolución de bajo nivel a múltiples escalas para lograr una operación de sobremuestreo más precisa. Finalmente, se introdujo el módulo SENet en la red para mejorar la interacción de la información después de la fusión de características y mejorar la precisión de segmentación del modelo en conjuntos de datos complejos. Los resultados experimentales demuestran que el modelo Imp-DeepLabV3+ logró una alta precisión de píxeles del 99.4%, una precisión media de píxeles del 98.1% y una intersección media sobre la unión del 96.8%. En comparación con el modelo original DeepLabV3+, el rendimiento de segmentación del modelo mejorado mejoró significativamente. Además, el rendimiento general de segmentación del modelo Imp-DeepLabV3+ superó al de otros modelos de segmentación semántica comúnmente utilizados, como las Redes Neuronales Convolucionales Completas (FCNs), el Pooling Piramidal Espacial Atronado Reducido (LR-ASPP) y U-Net. Por lo tanto, este estudio puede aplicarse al campo de la segmentación de escenas y es beneficioso para analizar más a fondo la información individual y promover el desarrollo de la ganadería inteligente.