Crted: detección de objetos de pocas tomas a través de Correlation-RPN y codificador-decodificador Transformer
Autores: Chen, Jinlong; Xu, Kejian; Ning, Yi; Jiang, Lianyuan; Xu, Zhi
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Crted: detección de objetos de pocas tomas a través de Correlation-RPN y codificador-decodificador Transformer
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Detección de objetos de pocas tomas
Anotaciones
Característica de correlación
Codificador-decodificador de transformador
Red de entrenamiento
Detector de objetos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
La detección de objetos de pocas muestras (FSOD) tiene como objetivo abordar el desafío de requerir un número sustancial de anotaciones para el entrenamiento en la detección de objetos convencional, que es muy laborioso. Sin embargo, los métodos de pocas muestras existentes logran una alta precisión con el sacrificio de tiempo para un ajuste fino exhaustivo o tienen un rendimiento deficiente en la adaptación de nuevas clases. Presumimos que la razón principal es que la característica de correlación valiosa entre diferentes categorías no se explota suficientemente, lo que dificulta la generalización del conocimiento de las categorías base a las nuevas categorías para la detección de objetos. En este artículo, proponemos la detección de objetos de pocas muestras a través de Correlation-RPN y el codificador-decodificador del transformador (CRTED), una red de entrenamiento novedosa para aprender características relevantes de objetos de correlación interclase y compacidad intraclase mientras se suprimen características agnósticas a objetos en el fondo con muestras anotadas limitadas. Y también introducimos una estrategia de entrenamiento de contraste de tupla de cuatro vías para activar positivamente el progreso de entrenamiento de nuestro detector de objetos. Los experimentos en dos conjuntos de datos de pocas muestras (Pascal VOC, MS-COCO) demuestran que nuestro CRTED propuesto sin un ajuste fino adicional puede lograr un rendimiento comparable con trabajos actuales de ajuste fino de última generación. Los códigos y modelos pre-entrenados serán publicados.
Descripción
La detección de objetos de pocas muestras (FSOD) tiene como objetivo abordar el desafío de requerir un número sustancial de anotaciones para el entrenamiento en la detección de objetos convencional, que es muy laborioso. Sin embargo, los métodos de pocas muestras existentes logran una alta precisión con el sacrificio de tiempo para un ajuste fino exhaustivo o tienen un rendimiento deficiente en la adaptación de nuevas clases. Presumimos que la razón principal es que la característica de correlación valiosa entre diferentes categorías no se explota suficientemente, lo que dificulta la generalización del conocimiento de las categorías base a las nuevas categorías para la detección de objetos. En este artículo, proponemos la detección de objetos de pocas muestras a través de Correlation-RPN y el codificador-decodificador del transformador (CRTED), una red de entrenamiento novedosa para aprender características relevantes de objetos de correlación interclase y compacidad intraclase mientras se suprimen características agnósticas a objetos en el fondo con muestras anotadas limitadas. Y también introducimos una estrategia de entrenamiento de contraste de tupla de cuatro vías para activar positivamente el progreso de entrenamiento de nuestro detector de objetos. Los experimentos en dos conjuntos de datos de pocas muestras (Pascal VOC, MS-COCO) demuestran que nuestro CRTED propuesto sin un ajuste fino adicional puede lograr un rendimiento comparable con trabajos actuales de ajuste fino de última generación. Los códigos y modelos pre-entrenados serán publicados.