Pseudo labels para adaptación de dominio no supervisada: una revisión
Autores: Li, Yundong; Guo, Longxia; Ge, Yizheng
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Pseudo labels para adaptación de dominio no supervisada: una revisión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Aprendizaje automático
Adaptación de dominio
Diferencia de distribución
Distribuciones de probabilidad condicional
Aprendizaje no supervisado
Pseudoetiquetado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 26
Citaciones: Sin citaciones
El aprendizaje automático convencional se basa en dos suposiciones: (1) los conjuntos de datos de entrenamiento y prueba siguen la misma distribución independiente, y (2) una cantidad adecuada de muestras es esencial para lograr un rendimiento óptimo del modelo durante el entrenamiento. Sin embargo, cumplir con estas dos suposiciones puede ser desafiante en escenarios del mundo real. La adaptación de dominio (DA) es un subcampo del aprendizaje de transferencia que se centra en reducir la diferencia de distribución entre el dominio fuente () y el dominio objetivo () y posteriormente aplicar el conocimiento adquirido de la tarea a la tarea. La mayoría de los métodos actuales de DA buscan lograr la invarianza de dominio al alinear las distribuciones de probabilidad marginales de la . y la . Estudios recientes han señalado que alinear solo las distribuciones de probabilidad marginales no es suficiente y que la alineación de las distribuciones de probabilidad condicionales es igualmente importante para la migración de conocimientos. No obstante, la DA no supervisada presenta una dificultad más significativa en la alineación de las distribuciones de probabilidad condicionales debido a la falta de etiquetas para la . En respuesta a este problema, varios métodos propuestos por investigadores, incluido el pseudoetiquetado, ofrecen soluciones novedosas para abordar el problema. En este artículo, analizamos sistemáticamente varios algoritmos de pseudoetiquetado y sus aplicaciones en la DA no supervisada. Primero , resumimos los métodos de generación de pseudoetiquetas basados en clasificadores individuales y múltiples y las acciones tomadas para abordar el problema de muestras desequilibradas. En segundo lugar, investigamos la aplicación del pseudoetiquetado en la alineación de características de categoría y en la mejora de la discriminación de características. Finalmente, señalamos los desafíos y tendencias de los algoritmos de pseudoetiquetado. Hasta donde sabemos, este artículo es la revisión inicial de las técnicas de pseudoetiquetado para la DA no supervisada.
Descripción
El aprendizaje automático convencional se basa en dos suposiciones: (1) los conjuntos de datos de entrenamiento y prueba siguen la misma distribución independiente, y (2) una cantidad adecuada de muestras es esencial para lograr un rendimiento óptimo del modelo durante el entrenamiento. Sin embargo, cumplir con estas dos suposiciones puede ser desafiante en escenarios del mundo real. La adaptación de dominio (DA) es un subcampo del aprendizaje de transferencia que se centra en reducir la diferencia de distribución entre el dominio fuente () y el dominio objetivo () y posteriormente aplicar el conocimiento adquirido de la tarea a la tarea. La mayoría de los métodos actuales de DA buscan lograr la invarianza de dominio al alinear las distribuciones de probabilidad marginales de la . y la . Estudios recientes han señalado que alinear solo las distribuciones de probabilidad marginales no es suficiente y que la alineación de las distribuciones de probabilidad condicionales es igualmente importante para la migración de conocimientos. No obstante, la DA no supervisada presenta una dificultad más significativa en la alineación de las distribuciones de probabilidad condicionales debido a la falta de etiquetas para la . En respuesta a este problema, varios métodos propuestos por investigadores, incluido el pseudoetiquetado, ofrecen soluciones novedosas para abordar el problema. En este artículo, analizamos sistemáticamente varios algoritmos de pseudoetiquetado y sus aplicaciones en la DA no supervisada. Primero , resumimos los métodos de generación de pseudoetiquetas basados en clasificadores individuales y múltiples y las acciones tomadas para abordar el problema de muestras desequilibradas. En segundo lugar, investigamos la aplicación del pseudoetiquetado en la alineación de características de categoría y en la mejora de la discriminación de características. Finalmente, señalamos los desafíos y tendencias de los algoritmos de pseudoetiquetado. Hasta donde sabemos, este artículo es la revisión inicial de las técnicas de pseudoetiquetado para la DA no supervisada.