Vectores de Parche Locales Codificados por Vectores de Fisher para Clasificación de Imágenes
Autores: Chen, Shuangshuang; Liu, Huiyi; Zeng, Xiaoqin; Qian, Subin; Wei, Wei; Wu, Guomin; Duan, Baobin
Idioma: Inglés
Editor: MDPI
Año: 2018
Acceso abierto
Artículo científico
2018
Vectores de Parche Locales Codificados por Vectores de Fisher para Clasificación de Imágenes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Clasificación de imágenes
Descriptores locales
Vector de Fisher
Estrategias de muestreo
Información espacial
Selección de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El objetivo de este trabajo es la clasificación de imágenes, cuyo propósito es agrupar imágenes en categorías semánticas correspondientes. Se realizan cuatro contribuciones de la siguiente manera: (i) Para simplificar y hacer más eficiente el cálculo, adoptamos directamente vectores de parches de imagen en bruto como descriptores locales codificados posteriormente por el vector de Fisher (FV); (ii) Para obtener características locales representativas dentro del marco de codificación FV, comparamos y analizamos tres estrategias de muestreo típicas: muestreo aleatorio, muestreo basado en saliencia y muestreo denso; (iii) Con el fin de incrustar tanto información espacial global como local en las características locales, construimos una estructura de geometría espacial mejorada que muestra un buen rendimiento; (iv) Para reducir los costos de almacenamiento y CPU de vectores de alta dimensión, adoptamos un nuevo método de selección de características basado en información mutua supervisada (MI), que elige características mediante un algoritmo de ordenación por importancia. Informamos resultados experimentales en el conjunto de datos STL-10. Muestra un rendimiento muy prometedor con este marco simple y eficiente en comparación con métodos convencionales.
Descripción
El objetivo de este trabajo es la clasificación de imágenes, cuyo propósito es agrupar imágenes en categorías semánticas correspondientes. Se realizan cuatro contribuciones de la siguiente manera: (i) Para simplificar y hacer más eficiente el cálculo, adoptamos directamente vectores de parches de imagen en bruto como descriptores locales codificados posteriormente por el vector de Fisher (FV); (ii) Para obtener características locales representativas dentro del marco de codificación FV, comparamos y analizamos tres estrategias de muestreo típicas: muestreo aleatorio, muestreo basado en saliencia y muestreo denso; (iii) Con el fin de incrustar tanto información espacial global como local en las características locales, construimos una estructura de geometría espacial mejorada que muestra un buen rendimiento; (iv) Para reducir los costos de almacenamiento y CPU de vectores de alta dimensión, adoptamos un nuevo método de selección de características basado en información mutua supervisada (MI), que elige características mediante un algoritmo de ordenación por importancia. Informamos resultados experimentales en el conjunto de datos STL-10. Muestra un rendimiento muy prometedor con este marco simple y eficiente en comparación con métodos convencionales.