logo móvil
Contáctanos

Red en escala múltiple para la detección de objetos

Autores: Pei, Yuanhua; Dong, Yongsheng; Zheng, Lintao; Ma, Jinwen

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Red en escala múltiple para la detección de objetos


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aprendizaje profundo
Detección de objetos
Tamaño pequeño
Problemas de desequilibrio
Red de coincidencia selectiva de características a múltiples escalas
MFSMNet

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 23

Citaciones: Sin citaciones


Descripción
Numerosos métodos de detección de objetos basados en aprendizaje profundo han logrado un excelente rendimiento. Sin embargo, el rendimiento en la detección de objetos de tamaño pequeño y los problemas de desequilibrio de muestras positivas y negativas no son satisfactorios. Proponemos una red de coincidencia selectiva de características a múltiples escalas (MFSMNet) para mejorar el rendimiento de la detección de objetos de tamaño pequeño y aliviar los problemas de desequilibrio de muestras positivas y negativas. Primero, construimos un módulo de mejora semántica a múltiples escalas (MSEM) para compensar la pérdida de información de los objetivos de tamaño pequeño durante el muestreo descendente al obtener información semántica más rica de características en múltiples escalas. Luego, diseñamos la estrategia de coincidencia selectiva de anclaje (ASM) para aliviar el entrenamiento dominado por muestras negativas causado por el desequilibrio de muestras positivas y negativas, que convierte los valores de desplazamiento de la salida de la rama de localización en la cabeza de detección en puntajes de localización y reduce las muestras negativas descartando anclajes de baja calidad. Finalmente, una serie de experimentos cuantitativos y cualitativos en los conjuntos de datos Microsoft COCO 2017 y PASCAL VOC 2007 + 2012 muestran que nuestro método es competitivo en comparación con otros nueve métodos representativos. MFSMNet se ejecuta en una GeForce RTX 3090.

Otros recursos que podrían interesarte

Temas Virtualpro