Detección de Objetos Nuevos sin Ajuste Fino en Escenarios de Ensamblaje mediante Detección de Objetos Agnóstica a la Clase y Re-Identificación de Objetos
Autores: Eisenbach, Markus; Franke, Henning; Franze, Erik; Köhler, Mona; Aganian, Dustin; Seichter, Daniel; Gross, Horst-Michael
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Detección de Objetos Nuevos sin Ajuste Fino en Escenarios de Ensamblaje mediante Detección de Objetos Agnóstica a la Clase y Re-Identificación de Objetos
Categoría
Procesos industriales
Subcategoría
Automatización industrial
Palabras clave
Detección de objetos
Agentes autónomos
Incrustaciones discriminativas
Modelo de reidentificación de objetos
Pocos ejemplos
Escenario de ensamblaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 28
Citaciones: Sin citaciones
La detección de objetos es una capacidad crucial de los agentes autónomos para la colaboración humano-robot, ya que facilita la identificación del estado de procesamiento actual. En escenarios industriales, no es común tener un conocimiento completo de todos los objetos involucrados en una tarea dada. Además, el entrenamiento durante el despliegue no es una opción viable. En consecuencia, existe la necesidad de un detector que sea capaz de adaptarse a objetos nuevos durante el despliegue sin la necesidad de reentrenar o ajustar en nuevos datos. Para lograr esto, proponemos aprovechar la capacidad de los embeddings discriminativos aprendidos por un modelo de reidentificación de objetos para generalizar a categorías desconocidas descritas por unos pocos ejemplos. Para ello, extraemos recortes de objetos con un detector agnóstico a la clase y luego comparamos las características del objeto con los prototipos de los objetos nuevos. Además, demostramos que el embedding también es efectivo para predecir regiones de interés, lo que reduce el espacio de búsqueda del detector agnóstico a la clase y, en consecuencia, aumenta la velocidad de procesamiento. La efectividad de nuestro enfoque se evalúa en un escenario de ensamblaje, en el que la mayoría de los objetos pertenecen a categorías distintas de las presentes en los conjuntos de datos de entrenamiento. Nuestros experimentos demuestran que, en este escenario, nuestro enfoque supera al actual mejor enfoque de detección de objetos de pocos ejemplos, DE-ViT, que tampoco realiza ajuste en nuevos datos, en términos de capacidad de detección y velocidad de inferencia.
Descripción
La detección de objetos es una capacidad crucial de los agentes autónomos para la colaboración humano-robot, ya que facilita la identificación del estado de procesamiento actual. En escenarios industriales, no es común tener un conocimiento completo de todos los objetos involucrados en una tarea dada. Además, el entrenamiento durante el despliegue no es una opción viable. En consecuencia, existe la necesidad de un detector que sea capaz de adaptarse a objetos nuevos durante el despliegue sin la necesidad de reentrenar o ajustar en nuevos datos. Para lograr esto, proponemos aprovechar la capacidad de los embeddings discriminativos aprendidos por un modelo de reidentificación de objetos para generalizar a categorías desconocidas descritas por unos pocos ejemplos. Para ello, extraemos recortes de objetos con un detector agnóstico a la clase y luego comparamos las características del objeto con los prototipos de los objetos nuevos. Además, demostramos que el embedding también es efectivo para predecir regiones de interés, lo que reduce el espacio de búsqueda del detector agnóstico a la clase y, en consecuencia, aumenta la velocidad de procesamiento. La efectividad de nuestro enfoque se evalúa en un escenario de ensamblaje, en el que la mayoría de los objetos pertenecen a categorías distintas de las presentes en los conjuntos de datos de entrenamiento. Nuestros experimentos demuestran que, en este escenario, nuestro enfoque supera al actual mejor enfoque de detección de objetos de pocos ejemplos, DE-ViT, que tampoco realiza ajuste en nuevos datos, en términos de capacidad de detección y velocidad de inferencia.