ICNet: una red de segmentación de instancias de doble rama para el conteo de cerdos de alta precisión
Autores: Liu, Shanghao; Zhao, Chunjiang; Zhang, Hongming; Li, Qifeng; Li, Shuqin; Chen, Yini; Gao, Ronghua; Wang, Rong; Li, Xuwen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
ICNet: una red de segmentación de instancias de doble rama para el conteo de cerdos de alta precisión
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Ciencias Agrícolas y Biológicas Generales
Palabras clave
Número de cerdos
Tecnología de visión por computadora
Escasez de conjuntos de datos
Segmentación de instancias
ICNet
Conteo de cerdos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Una comprensión clara del número de cerdos juega un papel crucial en la gestión de la cría. La tecnología de visión por computadora posee varias ventajas, ya que es inofensiva y ahorra trabajo en comparación con los métodos de conteo tradicionales. Sin embargo, los métodos existentes aún enfrentan algunos desafíos, como: (1) la falta de un conjunto de datos sustancial de conteo de cerdos de alta precisión; (2) la creación de un conjunto de datos para la segmentación de instancias puede ser un proceso que consume mucho tiempo y mano de obra; (3) la oclusión interactiva y la superposición siempre conducen a un reconocimiento incorrecto de los cerdos; (4) los métodos existentes para el conteo, como la detección de objetos, tienen una precisión limitada. Para abordar los problemas de escasez de conjuntos de datos y de etiquetado manual intensivo, creamos una herramienta de etiquetado de instancias semiautomática (SAI) para ayudarnos a producir un conjunto de datos de conteo de cerdos de alta precisión llamado Count1200 que incluye 1220 imágenes y 25,762 instancias. La velocidad a la que creamos etiquetas supera con creces la velocidad de la anotación manual. En este trabajo se propone un modelo de segmentación de instancias conciso y eficiente construido sobre varios módulos novedosos, denominado Red de Conteo de Instancias (ICNet), para el conteo de cerdos. ICNet es un modelo de doble rama ingeniosamente formado por una combinación de varias capas, que se llama Capa de Convoluciones Deformables Paralelas (PDCL), que se entrena desde cero y está compuesto principalmente por un par de bloques de convolución deformables paralelos (PDCBs). Aprovechamos eficazmente la característica de modelar secuencias a larga distancia para construir nuestro bloque básico y capa de cálculo. Junto con los beneficios de un gran campo receptivo efectivo, PDCL logra un mejor rendimiento para objetos a múltiples escalas. En el equilibrio entre recursos computacionales y rendimiento, ICNet demuestra un excelente rendimiento y supera a otros modelos en Count1200, donde se obtienen un 71.4% y un 95.7% en nuestros experimentos. Este trabajo proporciona inspiración para la creación rápida de conjuntos de datos de alta precisión y propone un enfoque preciso para el conteo de cerdos.
Descripción
Una comprensión clara del número de cerdos juega un papel crucial en la gestión de la cría. La tecnología de visión por computadora posee varias ventajas, ya que es inofensiva y ahorra trabajo en comparación con los métodos de conteo tradicionales. Sin embargo, los métodos existentes aún enfrentan algunos desafíos, como: (1) la falta de un conjunto de datos sustancial de conteo de cerdos de alta precisión; (2) la creación de un conjunto de datos para la segmentación de instancias puede ser un proceso que consume mucho tiempo y mano de obra; (3) la oclusión interactiva y la superposición siempre conducen a un reconocimiento incorrecto de los cerdos; (4) los métodos existentes para el conteo, como la detección de objetos, tienen una precisión limitada. Para abordar los problemas de escasez de conjuntos de datos y de etiquetado manual intensivo, creamos una herramienta de etiquetado de instancias semiautomática (SAI) para ayudarnos a producir un conjunto de datos de conteo de cerdos de alta precisión llamado Count1200 que incluye 1220 imágenes y 25,762 instancias. La velocidad a la que creamos etiquetas supera con creces la velocidad de la anotación manual. En este trabajo se propone un modelo de segmentación de instancias conciso y eficiente construido sobre varios módulos novedosos, denominado Red de Conteo de Instancias (ICNet), para el conteo de cerdos. ICNet es un modelo de doble rama ingeniosamente formado por una combinación de varias capas, que se llama Capa de Convoluciones Deformables Paralelas (PDCL), que se entrena desde cero y está compuesto principalmente por un par de bloques de convolución deformables paralelos (PDCBs). Aprovechamos eficazmente la característica de modelar secuencias a larga distancia para construir nuestro bloque básico y capa de cálculo. Junto con los beneficios de un gran campo receptivo efectivo, PDCL logra un mejor rendimiento para objetos a múltiples escalas. En el equilibrio entre recursos computacionales y rendimiento, ICNet demuestra un excelente rendimiento y supera a otros modelos en Count1200, donde se obtienen un 71.4% y un 95.7% en nuestros experimentos. Este trabajo proporciona inspiración para la creación rápida de conjuntos de datos de alta precisión y propone un enfoque preciso para el conteo de cerdos.