GenericConv: Un modelo genérico para la clasificación de escenas de imágenes utilizando aprendizaje de pocos ejemplos
Autores: Soudy, Mohamed; Afify, Yasmine M.; Badr, Nagwa
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
GenericConv: Un modelo genérico para la clasificación de escenas de imágenes utilizando aprendizaje de pocos ejemplos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Clasificación de escenas
Detección de objetos
Clasificación de objetos
Aprendizaje automático
Aprendizaje por transferencia
Aprendizaje con pocos ejemplos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La clasificación de escenas es una de las tareas más complejas en visión por computadora. La precisión de la clasificación de escenas depende de otras subtareas como la detección de objetos y la clasificación de objetos. Se pueden lograr resultados precisos al emplear la detección de objetos en la clasificación de escenas, ya que la información previa sobre los objetos en la imagen conducirá a una interpretación más fácil del contenido de la imagen. El aprendizaje automático y el aprendizaje por transferencia se utilizan ampliamente en la clasificación de escenas, logrando un rendimiento óptimo. A pesar del prometedor rendimiento de los modelos existentes en la clasificación de escenas, todavía hay problemas importantes. Primero, la fase de entrenamiento de los modelos requiere una gran cantidad de datos, lo cual es una tarea difícil y que consume mucho tiempo. Además, la mayoría de los modelos dependen de datos previamente vistos en el conjunto de entrenamiento, lo que resulta en modelos ineficaces que solo pueden identificar muestras que son similares al conjunto de entrenamiento. Como resultado, se ha introducido el aprendizaje de pocos ejemplos. Aunque se han reportado pocos intentos de aplicar el aprendizaje de pocos ejemplos a la clasificación de escenas, estos resultaron en una precisión perfecta. Motivados por estos hallazgos, en este artículo implementamos un nuevo modelo de aprendizaje de pocos ejemplos, GenericConv, para la clasificación de escenas que ha sido evaluado utilizando conjuntos de datos de referencia: MiniSun, MiniPlaces y MIT-Indoor 67. Los resultados experimentales muestran que el modelo propuesto, GenericConv, supera a los otros modelos de referencia en los tres conjuntos de datos, logrando precisiones de 52.16 +/- 0.015, 35.86 +/- 0.014 y 37.26 +/- 0.014 para cinco ejemplos en los conjuntos de datos MiniSun, MiniPlaces y MIT-Indoor 67, respectivamente.
Descripción
La clasificación de escenas es una de las tareas más complejas en visión por computadora. La precisión de la clasificación de escenas depende de otras subtareas como la detección de objetos y la clasificación de objetos. Se pueden lograr resultados precisos al emplear la detección de objetos en la clasificación de escenas, ya que la información previa sobre los objetos en la imagen conducirá a una interpretación más fácil del contenido de la imagen. El aprendizaje automático y el aprendizaje por transferencia se utilizan ampliamente en la clasificación de escenas, logrando un rendimiento óptimo. A pesar del prometedor rendimiento de los modelos existentes en la clasificación de escenas, todavía hay problemas importantes. Primero, la fase de entrenamiento de los modelos requiere una gran cantidad de datos, lo cual es una tarea difícil y que consume mucho tiempo. Además, la mayoría de los modelos dependen de datos previamente vistos en el conjunto de entrenamiento, lo que resulta en modelos ineficaces que solo pueden identificar muestras que son similares al conjunto de entrenamiento. Como resultado, se ha introducido el aprendizaje de pocos ejemplos. Aunque se han reportado pocos intentos de aplicar el aprendizaje de pocos ejemplos a la clasificación de escenas, estos resultaron en una precisión perfecta. Motivados por estos hallazgos, en este artículo implementamos un nuevo modelo de aprendizaje de pocos ejemplos, GenericConv, para la clasificación de escenas que ha sido evaluado utilizando conjuntos de datos de referencia: MiniSun, MiniPlaces y MIT-Indoor 67. Los resultados experimentales muestran que el modelo propuesto, GenericConv, supera a los otros modelos de referencia en los tres conjuntos de datos, logrando precisiones de 52.16 +/- 0.015, 35.86 +/- 0.014 y 37.26 +/- 0.014 para cinco ejemplos en los conjuntos de datos MiniSun, MiniPlaces y MIT-Indoor 67, respectivamente.