Utilizando adaptación de dominio para clasificación incremental de SVM de datos de cambio
Autores: Tang, Junya; Lin, Kuo-Yi; Li, Li
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Utilizando adaptación de dominio para clasificación incremental de SVM de datos de cambio
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Suposición común
Aprendizaje automático
Aprendizaje incremental
Cambio de concepto
Datos de entrenamiento
Costos computacionales
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Una suposición común en el aprendizaje automático es que los datos de entrenamiento son completos y la distribución de datos es fija. Sin embargo, en muchas aplicaciones prácticas, esta suposición no se cumple. El aprendizaje incremental se propuso para compensar este problema. Enfoques comunes incluyen el reentrenamiento de modelos y el aprendizaje incremental para compensar la escasez de datos de entrenamiento. El reentrenamiento de modelos es consumidor de tiempo y costoso computacionalmente, mientras que el aprendizaje incremental puede ahorrar tiempo y costos computacionales. Sin embargo, el cambio de concepto puede afectar el rendimiento. Dos problemas cruciales deben considerarse para abordar el cambio de concepto en el aprendizaje incremental: adquirir nuevos conocimientos sin olvidar los conocimientos adquiridos previamente y olvidar información obsoleta sin corromper la información válida. Este documento propone un enfoque de aprendizaje incremental de máquina de vectores de soporte con adaptación de dominio, considerando ambos problemas cruciales. En primer lugar, se utiliza una pequeña cantidad de nuevos datos para ajustar finamente el modelo anterior y generar un modelo sensible a los nuevos datos pero que retiene la información de los datos anteriores transfiriendo parámetros. En segundo lugar, se propone un mecanismo de ensamble y selección de modelos basado en la teoría bayesiana para mantener la información válida. Los experimentos computacionales indican que el rendimiento del modelo propuesto mejoró a medida que se adquirían nuevos datos. Además, se explora la influencia del grado de cambio de datos en el algoritmo. Se ha demostrado una mejora en el rendimiento en cuatro de cinco conjuntos de datos industriales y cuatro conjuntos de datos sintéticos sobre los algoritmos de máquina de vectores de soporte y máquina de vectores de soporte incremental.
Descripción
Una suposición común en el aprendizaje automático es que los datos de entrenamiento son completos y la distribución de datos es fija. Sin embargo, en muchas aplicaciones prácticas, esta suposición no se cumple. El aprendizaje incremental se propuso para compensar este problema. Enfoques comunes incluyen el reentrenamiento de modelos y el aprendizaje incremental para compensar la escasez de datos de entrenamiento. El reentrenamiento de modelos es consumidor de tiempo y costoso computacionalmente, mientras que el aprendizaje incremental puede ahorrar tiempo y costos computacionales. Sin embargo, el cambio de concepto puede afectar el rendimiento. Dos problemas cruciales deben considerarse para abordar el cambio de concepto en el aprendizaje incremental: adquirir nuevos conocimientos sin olvidar los conocimientos adquiridos previamente y olvidar información obsoleta sin corromper la información válida. Este documento propone un enfoque de aprendizaje incremental de máquina de vectores de soporte con adaptación de dominio, considerando ambos problemas cruciales. En primer lugar, se utiliza una pequeña cantidad de nuevos datos para ajustar finamente el modelo anterior y generar un modelo sensible a los nuevos datos pero que retiene la información de los datos anteriores transfiriendo parámetros. En segundo lugar, se propone un mecanismo de ensamble y selección de modelos basado en la teoría bayesiana para mantener la información válida. Los experimentos computacionales indican que el rendimiento del modelo propuesto mejoró a medida que se adquirían nuevos datos. Además, se explora la influencia del grado de cambio de datos en el algoritmo. Se ha demostrado una mejora en el rendimiento en cuatro de cinco conjuntos de datos industriales y cuatro conjuntos de datos sintéticos sobre los algoritmos de máquina de vectores de soporte y máquina de vectores de soporte incremental.