Fencetalk: explorando falsos negativos en la detección de objetos en movimiento
Autores: Lin, Yun-Wei; Liu, Yuh-Hwan; Lin, Yi-Bing; Hong, Jian-Chang
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Fencetalk: explorando falsos negativos en la detección de objetos en movimiento
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Modelos de aprendizaje profundo
Detección de objetos en movimiento
Datos de entrenamiento
FenceTalk
SSIM
Modelo Yolo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Los modelos de aprendizaje profundo suelen entrenarse con una gran cantidad de datos etiquetados para mejorar la precisión en la detección de objetos en movimiento en nuevos campos. Sin embargo, el modelo puede no ser lo suficientemente robusto debido a datos de entrenamiento insuficientes en el nuevo campo, lo que resulta en que algunos objetos en movimiento no sean detectados con éxito. Entrenar con datos que no son detectados con éxito por el modelo de aprendizaje profundo pre-entrenado puede mejorar efectivamente la precisión para el nuevo campo, pero es costoso recuperar los datos de imagen que contienen los objetos en movimiento de millones de imágenes al día para entrenar el modelo. Por lo tanto, proponemos FenceTalk, un sistema de detección de objetos en movimiento, que compara la diferencia entre el fotograma actual y la imagen de fondo basándose en la medida del índice de similitud estructural (SSIM). FenceTalk selecciona automáticamente imágenes sospechosas con objetos en movimiento que no son detectados con éxito por el modelo Yolo, para que los datos de entrenamiento puedan ser seleccionados a un costo laboral inferior. FenceTalk puede definir y actualizar eficazmente la imagen de fondo en el campo, reduciendo el error causado por cambios en la luz y la sombra, y seleccionando imágenes que contienen objetos en movimiento con un umbral óptimo. Nuestro estudio ha demostrado su rendimiento y generalidad utilizando datos reales de diferentes campos. Por ejemplo, en comparación con el modelo Yolo pre-entrenado utilizando el conjunto de datos MS COCO, la recuperación general de FenceTalk aumentó del 72.36% al 98.39% para el modelo entrenado con los datos seleccionados por SSIM. La recuperación de FenceTalk, combinada con Yolo y SSIM, puede superar el 99%.
Descripción
Los modelos de aprendizaje profundo suelen entrenarse con una gran cantidad de datos etiquetados para mejorar la precisión en la detección de objetos en movimiento en nuevos campos. Sin embargo, el modelo puede no ser lo suficientemente robusto debido a datos de entrenamiento insuficientes en el nuevo campo, lo que resulta en que algunos objetos en movimiento no sean detectados con éxito. Entrenar con datos que no son detectados con éxito por el modelo de aprendizaje profundo pre-entrenado puede mejorar efectivamente la precisión para el nuevo campo, pero es costoso recuperar los datos de imagen que contienen los objetos en movimiento de millones de imágenes al día para entrenar el modelo. Por lo tanto, proponemos FenceTalk, un sistema de detección de objetos en movimiento, que compara la diferencia entre el fotograma actual y la imagen de fondo basándose en la medida del índice de similitud estructural (SSIM). FenceTalk selecciona automáticamente imágenes sospechosas con objetos en movimiento que no son detectados con éxito por el modelo Yolo, para que los datos de entrenamiento puedan ser seleccionados a un costo laboral inferior. FenceTalk puede definir y actualizar eficazmente la imagen de fondo en el campo, reduciendo el error causado por cambios en la luz y la sombra, y seleccionando imágenes que contienen objetos en movimiento con un umbral óptimo. Nuestro estudio ha demostrado su rendimiento y generalidad utilizando datos reales de diferentes campos. Por ejemplo, en comparación con el modelo Yolo pre-entrenado utilizando el conjunto de datos MS COCO, la recuperación general de FenceTalk aumentó del 72.36% al 98.39% para el modelo entrenado con los datos seleccionados por SSIM. La recuperación de FenceTalk, combinada con Yolo y SSIM, puede superar el 99%.