Integración de la transformada discreta de wavelets, DBSCAN y clasificadores para una recuperación eficiente de imágenes basada en contenido
Autores: Khalid, Muhammad Junaid; Irfan, Muhammad; Ali, Tariq; Gull, Muqaddas; Draz, Umar; Glowacz, Adam; Sulowicz, Maciej; Dziechciarz, Arkadiusz; AlKahtani, Fahad Salem; Hussain, Shafiq
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Integración de la transformada discreta de wavelets, DBSCAN y clasificadores para una recuperación eficiente de imágenes basada en contenido
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Visión por computadora
Vector de características de imagen
Recuperación de imágenes basada en contenido
Descriptores
Algoritmos de aprendizaje automático
Vectores de características
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 40
Citaciones: Sin citaciones
En el dominio de la visión por computadora, la representación eficiente de un vector de características de imagen para la recuperación de imágenes sigue siendo un problema significativo. Se ha llevado a cabo una amplia investigación sobre la Recuperación de Imágenes Basada en Contenido (CBIR) utilizando varios descriptores, y los algoritmos de aprendizaje automático con ciertos descriptores han mejorado significativamente el rendimiento de estos sistemas. En esta investigación propuesta, se implementó un nuevo esquema para CBIR para abordar el problema de la brecha semántica y formar un vector de características eficiente. Esta técnica se basó en la formación de histogramas de las imágenes de consulta y del conjunto de datos. Se calculó el autocorrelograma de las imágenes con respecto al formato RGB, seguido de la extracción de momentos. Para formar vectores de características eficientes, se aplicó la Transformada Wavelet Discreta (DWT) en un marco de multirresolución. Se formó un libro de códigos utilizando un enfoque de agrupamiento basado en densidad conocido como Agrupamiento Espacial Basado en Densidad de Aplicaciones con Ruido (DBSCAN). Se calculó el índice de similitud utilizando la distancia euclidiana entre el vector de características de la imagen de consulta y las imágenes del conjunto de datos. Se utilizaron diferentes clasificadores, como Vector de Soporte (SVM), Vecino más Cercano (KNN) y Árbol de Decisión, para la clasificación de imágenes. El experimento se realizó en tres conjuntos de datos disponibles públicamente, y el rendimiento del marco propuesto se comparó con otros marcos propuestos que han tenido un rendimiento positivo en términos de precisión.
Descripción
En el dominio de la visión por computadora, la representación eficiente de un vector de características de imagen para la recuperación de imágenes sigue siendo un problema significativo. Se ha llevado a cabo una amplia investigación sobre la Recuperación de Imágenes Basada en Contenido (CBIR) utilizando varios descriptores, y los algoritmos de aprendizaje automático con ciertos descriptores han mejorado significativamente el rendimiento de estos sistemas. En esta investigación propuesta, se implementó un nuevo esquema para CBIR para abordar el problema de la brecha semántica y formar un vector de características eficiente. Esta técnica se basó en la formación de histogramas de las imágenes de consulta y del conjunto de datos. Se calculó el autocorrelograma de las imágenes con respecto al formato RGB, seguido de la extracción de momentos. Para formar vectores de características eficientes, se aplicó la Transformada Wavelet Discreta (DWT) en un marco de multirresolución. Se formó un libro de códigos utilizando un enfoque de agrupamiento basado en densidad conocido como Agrupamiento Espacial Basado en Densidad de Aplicaciones con Ruido (DBSCAN). Se calculó el índice de similitud utilizando la distancia euclidiana entre el vector de características de la imagen de consulta y las imágenes del conjunto de datos. Se utilizaron diferentes clasificadores, como Vector de Soporte (SVM), Vecino más Cercano (KNN) y Árbol de Decisión, para la clasificación de imágenes. El experimento se realizó en tres conjuntos de datos disponibles públicamente, y el rendimiento del marco propuesto se comparó con otros marcos propuestos que han tenido un rendimiento positivo en términos de precisión.