Red en escala múltiple para la detección de objetos
Autores: Pei, Yuanhua; Dong, Yongsheng; Zheng, Lintao; Ma, Jinwen
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Red en escala múltiple para la detección de objetos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Aprendizaje profundo
Detección de objetos
Tamaño pequeño
Problemas de desequilibrio
Red de coincidencia selectiva de características a múltiples escalas
MFSMNet
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 23
Citaciones: Sin citaciones
Numerosos métodos de detección de objetos basados en aprendizaje profundo han logrado un excelente rendimiento. Sin embargo, el rendimiento en la detección de objetos de tamaño pequeño y los problemas de desequilibrio de muestras positivas y negativas no son satisfactorios. Proponemos una red de coincidencia selectiva de características a múltiples escalas (MFSMNet) para mejorar el rendimiento de la detección de objetos de tamaño pequeño y aliviar los problemas de desequilibrio de muestras positivas y negativas. Primero, construimos un módulo de mejora semántica a múltiples escalas (MSEM) para compensar la pérdida de información de los objetivos de tamaño pequeño durante el muestreo descendente al obtener información semántica más rica de características en múltiples escalas. Luego, diseñamos la estrategia de coincidencia selectiva de anclaje (ASM) para aliviar el entrenamiento dominado por muestras negativas causado por el desequilibrio de muestras positivas y negativas, que convierte los valores de desplazamiento de la salida de la rama de localización en la cabeza de detección en puntajes de localización y reduce las muestras negativas descartando anclajes de baja calidad. Finalmente, una serie de experimentos cuantitativos y cualitativos en los conjuntos de datos Microsoft COCO 2017 y PASCAL VOC 2007 + 2012 muestran que nuestro método es competitivo en comparación con otros nueve métodos representativos. MFSMNet se ejecuta en una GeForce RTX 3090.
Descripción
Numerosos métodos de detección de objetos basados en aprendizaje profundo han logrado un excelente rendimiento. Sin embargo, el rendimiento en la detección de objetos de tamaño pequeño y los problemas de desequilibrio de muestras positivas y negativas no son satisfactorios. Proponemos una red de coincidencia selectiva de características a múltiples escalas (MFSMNet) para mejorar el rendimiento de la detección de objetos de tamaño pequeño y aliviar los problemas de desequilibrio de muestras positivas y negativas. Primero, construimos un módulo de mejora semántica a múltiples escalas (MSEM) para compensar la pérdida de información de los objetivos de tamaño pequeño durante el muestreo descendente al obtener información semántica más rica de características en múltiples escalas. Luego, diseñamos la estrategia de coincidencia selectiva de anclaje (ASM) para aliviar el entrenamiento dominado por muestras negativas causado por el desequilibrio de muestras positivas y negativas, que convierte los valores de desplazamiento de la salida de la rama de localización en la cabeza de detección en puntajes de localización y reduce las muestras negativas descartando anclajes de baja calidad. Finalmente, una serie de experimentos cuantitativos y cualitativos en los conjuntos de datos Microsoft COCO 2017 y PASCAL VOC 2007 + 2012 muestran que nuestro método es competitivo en comparación con otros nueve métodos representativos. MFSMNet se ejecuta en una GeForce RTX 3090.