logo móvil
Contáctanos

Representaciones Multi-Fuente Adaptativas a la Tarea para el Reconocimiento de Imágenes con Pocas Muestras

Autores: Liu, Ge; Zhang, Zhongqiang; Fang, Xiangzhong

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Representaciones Multi-Fuente Adaptativas a la Tarea para el Reconocimiento de Imágenes con Pocas Muestras


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Convencional
Aprendizaje de pocos ejemplos
Multi-fuente
Cruzado de dominios
Representaciones
Reconocimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El aprendizaje convencional de pocos disparos (FSL) se centra principalmente en la transferencia de conocimiento de un único conjunto de datos fuente a un escenario de reconocimiento con solo unas pocas muestras de entrenamiento disponibles, pero aún así similar al dominio fuente. En este artículo, consideramos un entorno FSL más práctico donde están disponibles múltiples conjuntos de datos semánticamente diferentes para abordar una amplia gama de tareas FSL, especialmente para algunos escenarios de reconocimiento más allá de las imágenes naturales, como la teledetección y la imaginería médica. Esto se puede denominar FSL de múltiples fuentes y dominios cruzados. Para abordar el problema, proponemos un esquema de aprendizaje en dos etapas, denominado aprendizaje y adaptación de representaciones de múltiples fuentes (LAMR). En la primera etapa, proponemos una red de múltiples cabezales para obtener representaciones eficientes de múltiples dominios, donde todos los dominios fuente comparten la misma estructura base, excepto por las últimas capas de proyección paralelas para la especialización del dominio. Entrenamos las representaciones en un entorno de múltiples tareas donde cada tarea de clasificación en el dominio es asumida por un clasificador coseno. En la segunda etapa, considerando que la discriminación de instancias y la discriminación de clases son cruciales para un reconocimiento robusto, proponemos dos objetivos contrastivos para adaptar las representaciones preentrenadas a ser especializadas en la tarea con los datos de pocos disparos. Estudios de ablación cuidadosos verifican que LAMR mejora significativamente la transferibilidad de las representaciones, mostrando aumentos de rendimiento consistentes. También extendemos LAMR a FSL de una sola fuente introduciendo una estrategia de división de conjuntos de datos que divide equitativamente un conjunto de datos fuente en subdominios. Los resultados empíricos muestran que LAMR puede lograr un rendimiento SOTA en el benchmark BSCD-FSL y un rendimiento competitivo en mini-ImageNet, destacando su versatilidad y efectividad para FSL tanto de imágenes naturales como específicas.

Otros recursos que podrían interesarte

Temas Virtualpro