Reconocimiento de objetos sin tarea específica para robots móviles mediante coincidencia de imágenes de pocas tomas
Autores: Chiatti, Agnese; Bardaro, Gianluca; Bastianelli, Emanuele; Tiddi, Ilaria; Mitra, Prasenjit; Motta, Enrico
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Reconocimiento de objetos sin tarea específica para robots móviles mediante coincidencia de imágenes de pocas tomas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Robots móviles
Métodos de reconocimiento de objetos
Reconocimiento de pocas muestras
Objetos novedosos
Coincidencia de imágenes
Enfoques profundos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Para ayudar a los humanos con sus tareas diarias, se espera que los robots móviles naveguen por entornos complejos y dinámicos, presentando combinaciones impredecibles de objetos conocidos y desconocidos. La mayoría de los métodos de reconocimiento de objetos de última generación no son adecuados para este escenario porque requieren que: (i) todas las clases de objetos objetivo se conozcan de antemano, y (ii) se proporcione un gran número de ejemplos de entrenamiento para cada clase. Esta evidencia requiere métodos novedosos para manejar clases de objetos desconocidas, para las cuales inicialmente hay menos imágenes disponibles (reconocimiento de pocas tomas). Una forma de abordar el problema es aprender a relacionar objetos novedosos con su ejemplo de soporte más similar. Aquí, comparamos diferentes enfoques (superficiales y profundos) para la coincidencia de imágenes de pocas tomas en un nuevo conjunto de datos, que consiste en vistas 2D de tipos comunes de objetos extraídos de una combinación de ShapeNet y Google. Primero, evaluamos si la similitud de objetos aprendida a partir de una combinación de ShapeNet y Google puede escalar a nuevas clases de objetos, es decir, categorías no vistas en el momento del entrenamiento. Además, mostramos cómo la normalización de los embeddings aprendidos puede afectar las habilidades de generalización de los métodos probados, en el contexto de dos configuraciones novedosas: (i) donde se imprimen los pesos de una Red de dos ramas Convolucional y (ii) donde los embeddings de una Red Siamesa Convolucional se normalizan con L2.
Descripción
Para ayudar a los humanos con sus tareas diarias, se espera que los robots móviles naveguen por entornos complejos y dinámicos, presentando combinaciones impredecibles de objetos conocidos y desconocidos. La mayoría de los métodos de reconocimiento de objetos de última generación no son adecuados para este escenario porque requieren que: (i) todas las clases de objetos objetivo se conozcan de antemano, y (ii) se proporcione un gran número de ejemplos de entrenamiento para cada clase. Esta evidencia requiere métodos novedosos para manejar clases de objetos desconocidas, para las cuales inicialmente hay menos imágenes disponibles (reconocimiento de pocas tomas). Una forma de abordar el problema es aprender a relacionar objetos novedosos con su ejemplo de soporte más similar. Aquí, comparamos diferentes enfoques (superficiales y profundos) para la coincidencia de imágenes de pocas tomas en un nuevo conjunto de datos, que consiste en vistas 2D de tipos comunes de objetos extraídos de una combinación de ShapeNet y Google. Primero, evaluamos si la similitud de objetos aprendida a partir de una combinación de ShapeNet y Google puede escalar a nuevas clases de objetos, es decir, categorías no vistas en el momento del entrenamiento. Además, mostramos cómo la normalización de los embeddings aprendidos puede afectar las habilidades de generalización de los métodos probados, en el contexto de dos configuraciones novedosas: (i) donde se imprimen los pesos de una Red de dos ramas Convolucional y (ii) donde los embeddings de una Red Siamesa Convolucional se normalizan con L2.