Clasificación de imágenes para la extracción automática de características en datos de moda usados por humanos
Autores: Rohrmanstorfer, Stefan; Komarov, Mikhail; Mödritscher, Felix
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Clasificación de imágenes para la extracción automática de características en datos de moda usados por humanos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos de imagen
Sector de la moda
Modelo de clasificación de imagen
Redes neuronales convolucionales
TensorFlow
Precisión de validación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Con la cantidad siempre creciente de datos de imágenes, se ha vuelto una necesidad buscar y procesar automáticamente información en estas imágenes. Dado que la moda se captura en imágenes, el sector de la moda proporciona la base perfecta para ser respaldado por la integración de un servicio o aplicación que se base en un modelo de clasificación de imágenes. En este artículo, se analiza y discute el estado del arte de la clasificación de imágenes. Basándose en el conocimiento elaborado, se implementarán cuatro enfoques diferentes para extraer características con éxito de datos de moda. Con este propósito, se creó un conjunto de datos de moda usado por humanos con 2567 imágenes, pero se amplió significativamente mediante las operaciones de imagen realizadas. Los resultados muestran que las redes neuronales convolucionales son el estándar indiscutible para clasificar imágenes y que TensorFlow es la mejor biblioteca para construirlas. Además, a través de la introducción de capas de abandono, aumento de datos y aprendizaje por transferencia, se previno con éxito el sobreajuste del modelo y fue posible mejorar incrementalmente la precisión de validación del conjunto de datos creado, pasando de un 69% inicial a una precisión de validación final del 84%. Prendas de vestir más distintas como pantalones, zapatos y sombreros se clasificaron mejor que otras prendas de la parte superior del cuerpo.
Descripción
Con la cantidad siempre creciente de datos de imágenes, se ha vuelto una necesidad buscar y procesar automáticamente información en estas imágenes. Dado que la moda se captura en imágenes, el sector de la moda proporciona la base perfecta para ser respaldado por la integración de un servicio o aplicación que se base en un modelo de clasificación de imágenes. En este artículo, se analiza y discute el estado del arte de la clasificación de imágenes. Basándose en el conocimiento elaborado, se implementarán cuatro enfoques diferentes para extraer características con éxito de datos de moda. Con este propósito, se creó un conjunto de datos de moda usado por humanos con 2567 imágenes, pero se amplió significativamente mediante las operaciones de imagen realizadas. Los resultados muestran que las redes neuronales convolucionales son el estándar indiscutible para clasificar imágenes y que TensorFlow es la mejor biblioteca para construirlas. Además, a través de la introducción de capas de abandono, aumento de datos y aprendizaje por transferencia, se previno con éxito el sobreajuste del modelo y fue posible mejorar incrementalmente la precisión de validación del conjunto de datos creado, pasando de un 69% inicial a una precisión de validación final del 84%. Prendas de vestir más distintas como pantalones, zapatos y sombreros se clasificaron mejor que otras prendas de la parte superior del cuerpo.