Detección de gallinas muertas utilizando imágenes TIR-NIR-de profundidad y aprendizaje profundo en una granja comercial
Autores: Luo, Sheng; Ma, Yiming; Jiang, Feng; Wang, Hongying; Tong, Qin; Wang, Liangju
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Detección de gallinas muertas utilizando imágenes TIR-NIR-de profundidad y aprendizaje profundo en una granja comercial
Categoría
Ciencias Agrícolas y Biológicas
Subcategoría
Zootecnia
Palabras clave
Detección
Pollo muerto
Imágenes
Rendimiento
Multi-fuente
Modelos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 6
Citaciones: Sin citaciones
En la cría de gallinas ponedoras a gran escala, la detección oportuna de gallinas muertas ayuda a prevenir la infección cruzada, la transmisión de enfermedades y las pérdidas económicas. La detección de gallinas muertas aún se realiza manualmente y es uno de los principales costos laborales en las granjas comerciales. Este estudio propuso un nuevo método para la detección de gallinas muertas utilizando imágenes de múltiples fuentes y aprendizaje profundo, y evaluó el rendimiento de detección con diferentes imágenes de origen. Primero, introdujimos un método de registro de imágenes a nivel de píxel que utilizó información de profundidad para proyectar la imagen de infrarrojo cercano (NIR) y la imagen de profundidad en las coordenadas de la imagen de infrarrojo térmico (TIR), resultando en imágenes registradas. Luego, las imágenes registradas de una sola fuente (TIR, NIR, profundidad), de doble fuente (TIR-NIR, TIR-profundidad, NIR-profundidad) y de múltiples fuentes (TIR-NIR-profundidad) se utilizaron por separado para entrenar modelos de detección de gallinas muertas con redes de detección de objetos, incluyendo YOLOv8n, Deformable DETR, Cascade R-CNN y TOOD. Los resultados mostraron que, en un umbral de IoU (Intersección sobre Unión) de 0.5, el rendimiento de estos modelos no fue del todo el mismo. Entre ellos, el modelo que utilizó la imagen NIR-profundidad y Deformable DETR logró el mejor rendimiento, con una precisión promedio (AP) del 99.7% (IoU = 0.5) y un recall del 99.0% (IoU = 0.5). A medida que aumentó el umbral de IoU, encontramos lo siguiente: El modelo con la imagen NIR logró el mejor rendimiento entre los modelos con imágenes de una sola fuente, con un AP del 74.4% (IoU = 0.5:0.95) en Deformable DETR. El rendimiento con imágenes de doble fuente fue superior al de las imágenes de una sola fuente. El modelo con la imagen TIR-NIR o NIR-profundidad superó al modelo con la imagen TIR-profundidad, logrando un AP del 76.3% (IoU = 0.5:0.95) y 75.9% (IoU = 0.5:0.95) en Deformable DETR, respectivamente. El modelo con la imagen de múltiples fuentes también logró un rendimiento superior al de las imágenes de una sola fuente. Sin embargo, no hubo una mejora significativa en comparación con el modelo con la imagen TIR-NIR o NIR-profundidad, y el AP del modelo con imagen de múltiples fuentes fue del 76.7% (IoU = 0.5:0.95) en Deformable DETR. Al analizar el rendimiento de detección con diferentes imágenes de origen, este estudio proporcionó una referencia para seleccionar y utilizar imágenes de múltiples fuentes para detectar gallinas ponedoras muertas en granjas comerciales.
Descripción
En la cría de gallinas ponedoras a gran escala, la detección oportuna de gallinas muertas ayuda a prevenir la infección cruzada, la transmisión de enfermedades y las pérdidas económicas. La detección de gallinas muertas aún se realiza manualmente y es uno de los principales costos laborales en las granjas comerciales. Este estudio propuso un nuevo método para la detección de gallinas muertas utilizando imágenes de múltiples fuentes y aprendizaje profundo, y evaluó el rendimiento de detección con diferentes imágenes de origen. Primero, introdujimos un método de registro de imágenes a nivel de píxel que utilizó información de profundidad para proyectar la imagen de infrarrojo cercano (NIR) y la imagen de profundidad en las coordenadas de la imagen de infrarrojo térmico (TIR), resultando en imágenes registradas. Luego, las imágenes registradas de una sola fuente (TIR, NIR, profundidad), de doble fuente (TIR-NIR, TIR-profundidad, NIR-profundidad) y de múltiples fuentes (TIR-NIR-profundidad) se utilizaron por separado para entrenar modelos de detección de gallinas muertas con redes de detección de objetos, incluyendo YOLOv8n, Deformable DETR, Cascade R-CNN y TOOD. Los resultados mostraron que, en un umbral de IoU (Intersección sobre Unión) de 0.5, el rendimiento de estos modelos no fue del todo el mismo. Entre ellos, el modelo que utilizó la imagen NIR-profundidad y Deformable DETR logró el mejor rendimiento, con una precisión promedio (AP) del 99.7% (IoU = 0.5) y un recall del 99.0% (IoU = 0.5). A medida que aumentó el umbral de IoU, encontramos lo siguiente: El modelo con la imagen NIR logró el mejor rendimiento entre los modelos con imágenes de una sola fuente, con un AP del 74.4% (IoU = 0.5:0.95) en Deformable DETR. El rendimiento con imágenes de doble fuente fue superior al de las imágenes de una sola fuente. El modelo con la imagen TIR-NIR o NIR-profundidad superó al modelo con la imagen TIR-profundidad, logrando un AP del 76.3% (IoU = 0.5:0.95) y 75.9% (IoU = 0.5:0.95) en Deformable DETR, respectivamente. El modelo con la imagen de múltiples fuentes también logró un rendimiento superior al de las imágenes de una sola fuente. Sin embargo, no hubo una mejora significativa en comparación con el modelo con la imagen TIR-NIR o NIR-profundidad, y el AP del modelo con imagen de múltiples fuentes fue del 76.7% (IoU = 0.5:0.95) en Deformable DETR. Al analizar el rendimiento de detección con diferentes imágenes de origen, este estudio proporcionó una referencia para seleccionar y utilizar imágenes de múltiples fuentes para detectar gallinas ponedoras muertas en granjas comerciales.