Representaciones Multi-Fuente Adaptativas a la Tarea para el Reconocimiento de Imágenes con Pocas Muestras

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Representaciones Multi-Fuente Adaptativas a la Tarea para el Reconocimiento de Imágenes con Pocas Muestras

Autores: Liu, Ge; Zhang, Zhongqiang; Fang, Xiangzhong

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Representaciones Multi-Fuente Adaptativas a la Tarea para el Reconocimiento de Imágenes con Pocas Muestras

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Convencional

Aprendizaje de pocos ejemplos

Multi-fuente

Cruzado de dominios

Representaciones

Reconocimiento

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

El aprendizaje convencional de pocos disparos (FSL) se centra principalmente en la transferencia de conocimiento de un único conjunto de datos fuente a un escenario de reconocimiento con solo unas pocas muestras de entrenamiento disponibles, pero aún así similar al dominio fuente. En este artículo, consideramos un entorno FSL más práctico donde están disponibles múltiples conjuntos de datos semánticamente diferentes para abordar una amplia gama de tareas FSL, especialmente para algunos escenarios de reconocimiento más allá de las imágenes naturales, como la teledetección y la imaginería médica. Esto se puede denominar FSL de múltiples fuentes y dominios cruzados. Para abordar el problema, proponemos un esquema de aprendizaje en dos etapas, denominado aprendizaje y adaptación de representaciones de múltiples fuentes (LAMR). En la primera etapa, proponemos una red de múltiples cabezales para obtener representaciones eficientes de múltiples dominios, donde todos los dominios fuente comparten la misma estructura base, excepto por las últimas capas de proyección paralelas para la especialización del dominio. Entrenamos las representaciones en un entorno de múltiples tareas donde cada tarea de clasificación en el dominio es asumida por un clasificador coseno. En la segunda etapa, considerando que la discriminación de instancias y la discriminación de clases son cruciales para un reconocimiento robusto, proponemos dos objetivos contrastivos para adaptar las representaciones preentrenadas a ser especializadas en la tarea con los datos de pocos disparos. Estudios de ablación cuidadosos verifican que LAMR mejora significativamente la transferibilidad de las representaciones, mostrando aumentos de rendimiento consistentes. También extendemos LAMR a FSL de una sola fuente introduciendo una estrategia de división de conjuntos de datos que divide equitativamente un conjunto de datos fuente en subdominios. Los resultados empíricos muestran que LAMR puede lograr un rendimiento SOTA en el benchmark BSCD-FSL y un rendimiento competitivo en mini-ImageNet, destacando su versatilidad y efectividad para FSL tanto de imágenes naturales como específicas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro