Adaptación de dominio no supervisada para clasificación de imágenes utilizando la pérdida de tripletes no euclideana
Autores: Jabbar Sarhan, Riyam; Balafar, Mohammad Ali; Feizi Derakhshi, Mohammad Reza
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Adaptación de dominio no supervisada para clasificación de imágenes utilizando la pérdida de tripletes no euclideana
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Visión por computadora
Técnicas de aprendizaje profundo
Aprendizaje por transferencia
Adaptación de dominio de múltiples fuentes
Representación de características
Función de pérdida de tripletes
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 54
Citaciones: Sin citaciones
En los últimos años, las tareas de visión por computadora han utilizado cada vez más técnicas de aprendizaje profundo. Sin embargo, en algunas tareas, debido a datos insuficientes, el modelo no se entrena adecuadamente, lo que lleva a una disminución en la generalización. Cuando se entrena en un conjunto de datos y se prueba en otro conjunto de datos similar, el modelo predice resultados casi aleatorios. Este artículo presenta una adaptación de dominio de múltiples fuentes no supervisada que mejora el aprendizaje por transferencia y aumenta la generalización. En el método propuesto, un nuevo módulo infiere la fuente de los datos de entrada en función de sus características extraídas. Al hacer que el extractor de características compita contra este objetivo, la representación de características aprendida se generaliza mejor en todas las fuentes. Como resultado, se aprenden representaciones similares a las de diferentes fuentes. Es decir, la representación extraída es genérica e independiente de cualquier dominio en particular. En la etapa de entrenamiento, también se utiliza una función de pérdida de tripletes no euclidiana. Las representaciones similares para muestras pertenecientes a la misma clase pueden aprenderse de manera más efectiva utilizando la función de pérdida propuesta. Demostramos cómo el marco desarrollado puede aplicarse para mejorar la precisión y superar los resultados de metodologías de aprendizaje por transferencia ya efectivas. Demostramos cómo la estrategia propuesta funciona particularmente bien al tratar con diferentes dominios de conjuntos de datos o cuando hay datos insuficientes.
Descripción
En los últimos años, las tareas de visión por computadora han utilizado cada vez más técnicas de aprendizaje profundo. Sin embargo, en algunas tareas, debido a datos insuficientes, el modelo no se entrena adecuadamente, lo que lleva a una disminución en la generalización. Cuando se entrena en un conjunto de datos y se prueba en otro conjunto de datos similar, el modelo predice resultados casi aleatorios. Este artículo presenta una adaptación de dominio de múltiples fuentes no supervisada que mejora el aprendizaje por transferencia y aumenta la generalización. En el método propuesto, un nuevo módulo infiere la fuente de los datos de entrada en función de sus características extraídas. Al hacer que el extractor de características compita contra este objetivo, la representación de características aprendida se generaliza mejor en todas las fuentes. Como resultado, se aprenden representaciones similares a las de diferentes fuentes. Es decir, la representación extraída es genérica e independiente de cualquier dominio en particular. En la etapa de entrenamiento, también se utiliza una función de pérdida de tripletes no euclidiana. Las representaciones similares para muestras pertenecientes a la misma clase pueden aprenderse de manera más efectiva utilizando la función de pérdida propuesta. Demostramos cómo el marco desarrollado puede aplicarse para mejorar la precisión y superar los resultados de metodologías de aprendizaje por transferencia ya efectivas. Demostramos cómo la estrategia propuesta funciona particularmente bien al tratar con diferentes dominios de conjuntos de datos o cuando hay datos insuficientes.