Pérdida de clasificación de imágenes multi-etiqueta con un amplio margen profundo
Autores: Ma, Zhongchen; Li, Zongpeng; Zhan, Yongzhao
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Pérdida de clasificación de imágenes multi-etiqueta con un amplio margen profundo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Técnica de gran margen
Clasificación de imágenes multi-etiqueta
Función de pérdida de rango de gran margen profundo
Redes neuronales
Margen
Redes profundas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 18
Citaciones: Sin citaciones
La técnica de gran margen ha servido como base de varios resultados teóricos y empíricos exitosos en la clasificación de imágenes de múltiples etiquetas. Sin embargo, la mayoría de las técnicas de gran margen solo son adecuadas para modelos de múltiples etiquetas superficiales con representaciones de características predefinidas y algunas técnicas de gran margen de redes neuronales solo imponen márgenes en la capa de salida, lo cual no es adecuado para redes profundas. Basándose en la técnica de gran margen, se propone una función de pérdida de rango de gran margen profundo adecuada para cualquier estructura de red, que es capaz de imponer un margen en cualquier conjunto elegido de capas de una red profunda, permite elegir cualquier norma en la métrica que mide el margen entre etiquetas y es aplicable a cualquier arquitectura de red. Aunque el cálculo completo de la función de pérdida de rango de gran margen profundo tiene una complejidad temporal, donde denota el tamaño del conjunto de etiquetas, lo que podría causar problemas de escalabilidad cuando es grande, se propuso una técnica de muestreo negativo para hacer que la función de pérdida escala linealmente a . Los resultados experimentales en dos conjuntos de datos a gran escala, VOC2007 y MS-COCO, muestran que la función de clasificación de gran margen profundo mejora la robustez del modelo en tareas de clasificación de imágenes de múltiples etiquetas al tiempo que mejora el rendimiento anti-ruido del modelo.
Descripción
La técnica de gran margen ha servido como base de varios resultados teóricos y empíricos exitosos en la clasificación de imágenes de múltiples etiquetas. Sin embargo, la mayoría de las técnicas de gran margen solo son adecuadas para modelos de múltiples etiquetas superficiales con representaciones de características predefinidas y algunas técnicas de gran margen de redes neuronales solo imponen márgenes en la capa de salida, lo cual no es adecuado para redes profundas. Basándose en la técnica de gran margen, se propone una función de pérdida de rango de gran margen profundo adecuada para cualquier estructura de red, que es capaz de imponer un margen en cualquier conjunto elegido de capas de una red profunda, permite elegir cualquier norma en la métrica que mide el margen entre etiquetas y es aplicable a cualquier arquitectura de red. Aunque el cálculo completo de la función de pérdida de rango de gran margen profundo tiene una complejidad temporal, donde denota el tamaño del conjunto de etiquetas, lo que podría causar problemas de escalabilidad cuando es grande, se propuso una técnica de muestreo negativo para hacer que la función de pérdida escala linealmente a . Los resultados experimentales en dos conjuntos de datos a gran escala, VOC2007 y MS-COCO, muestran que la función de clasificación de gran margen profundo mejora la robustez del modelo en tareas de clasificación de imágenes de múltiples etiquetas al tiempo que mejora el rendimiento anti-ruido del modelo.