La generalización de dominio a través de la aumentación de datos: una encuesta de métodos, aplicaciones y desafíos
Autores: Mai, Junjie; Gao, Chongzhi; Bao, Jun
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
La generalización de dominio a través de la aumentación de datos: una encuesta de métodos, aplicaciones y desafíos
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Generalización de dominio
Aprendizaje automático
Aumento de datos
Cambios de dominio
Rendimiento del modelo
Datos del mundo real
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
La generalización de dominio (DG) se ha convertido en un área de investigación fundamental en el aprendizaje automático, centrándose en dotar a los modelos con la capacidad de generalizar de manera efectiva a dominios de prueba no vistos que difieren de la distribución de entrenamiento. Esta capacidad es crucial, ya que los datos del mundo real con frecuencia muestran cambios de dominio que violan la suposición de datos independientes e idénticamente distribuidos (i.i.d.), lo que resulta en declives significativos en el rendimiento del modelo. Entre las diversas estrategias para abordar la generalización de dominio, la ampliación de datos ha captado una atención sustancial como un enfoque efectivo para mitigar los cambios de dominio y mejorar la robustez del modelo. En esta encuesta, examinamos el papel de la ampliación de datos en la generalización de dominio, ofreciendo una visión general exhaustiva de sus métodos, aplicaciones y desafíos. Presentamos una taxonomía detallada de técnicas de ampliación de datos, categorizadas a lo largo de tres dimensiones: alcance, naturaleza y dependencia de entrenamiento. Además, proporcionamos un análisis comparativo de métodos clave, destacando sus fortalezas y limitaciones. Finalmente, exploramos las aplicaciones específicas del dominio de la ampliación de datos y analizamos su efectividad en mejorar la generalización en diversas tareas del mundo real, incluyendo visión por computadora, procesamiento de lenguaje natural, habla y robótica. Concluimos examinando los desafíos clave, como el costo computacional y el sobreajuste de la ampliación, y delineamos direcciones prometedoras de investigación, con un enfoque en avanzar en técnicas de ampliación cruzada-modal y desarrollar benchmarks de evaluación estandarizados.
Descripción
La generalización de dominio (DG) se ha convertido en un área de investigación fundamental en el aprendizaje automático, centrándose en dotar a los modelos con la capacidad de generalizar de manera efectiva a dominios de prueba no vistos que difieren de la distribución de entrenamiento. Esta capacidad es crucial, ya que los datos del mundo real con frecuencia muestran cambios de dominio que violan la suposición de datos independientes e idénticamente distribuidos (i.i.d.), lo que resulta en declives significativos en el rendimiento del modelo. Entre las diversas estrategias para abordar la generalización de dominio, la ampliación de datos ha captado una atención sustancial como un enfoque efectivo para mitigar los cambios de dominio y mejorar la robustez del modelo. En esta encuesta, examinamos el papel de la ampliación de datos en la generalización de dominio, ofreciendo una visión general exhaustiva de sus métodos, aplicaciones y desafíos. Presentamos una taxonomía detallada de técnicas de ampliación de datos, categorizadas a lo largo de tres dimensiones: alcance, naturaleza y dependencia de entrenamiento. Además, proporcionamos un análisis comparativo de métodos clave, destacando sus fortalezas y limitaciones. Finalmente, exploramos las aplicaciones específicas del dominio de la ampliación de datos y analizamos su efectividad en mejorar la generalización en diversas tareas del mundo real, incluyendo visión por computadora, procesamiento de lenguaje natural, habla y robótica. Concluimos examinando los desafíos clave, como el costo computacional y el sobreajuste de la ampliación, y delineamos direcciones prometedoras de investigación, con un enfoque en avanzar en técnicas de ampliación cruzada-modal y desarrollar benchmarks de evaluación estandarizados.