Máquina tensorial de soporte escasa con funciones de kernel escaladas
Autores: Wang, Shuangyue; Luo, Ziyan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Máquina tensorial de soporte escasa con funciones de kernel escaladas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Máquina de tensor de soporte
Modelo STM disperso
Clasificación binaria
Trucos de kernel
Kernel RBF gaussiano
Restricción de esparcidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
Como uno de los métodos de aprendizaje de tensores supervisados, la máquina tensorial de soporte (STM) para la clasificación de datos tensoriales está recibiendo cada vez más atención en el aprendizaje automático y aplicaciones relacionadas, incluyendo imágenes de teledetección, procesamiento de video, diagnóstico de fallas, etc. Los enfoques STM existentes carecen de consideración de los tensores de soporte en términos de reducción de datos. Para abordar esta deficiencia, construimos un modelo novedoso de STM disperso para controlar el número de tensores de soporte en la clasificación binaria de datos tensoriales. La dispersión se impone en las variables duales en el contexto del espacio de características, lo que facilita la clasificación no lineal con trucos de kernel, como el kernel RBF gaussiano ampliamente utilizado. Para aliviar el riesgo local asociado con el ancho constante en el kernel tensorial RBF gaussiano, proponemos un enfoque de clasificación de dos etapas; en la segunda etapa, abogamos por una estrategia de escalado en la función del kernel de manera dependiente de los datos, utilizando la información de los tensores de soporte obtenidos de la primera etapa. Los modelos de optimización esenciales en ambas etapas comparten el mismo tipo, que es no convexo y discontinuo, debido a la restricción de dispersión. Para resolver el desafío computacional, se adapta un método de Newton de subespacio para la optimización con restricción de dispersión para una computación efectiva con convergencia local. Se realizaron experimentos numéricos en conjuntos de datos reales, y los resultados numéricos demuestran la efectividad de nuestro enfoque de STM disperso de dos etapas propuesto en términos de precisión de clasificación, en comparación con los enfoques de clasificación binaria de vanguardia.
Descripción
Como uno de los métodos de aprendizaje de tensores supervisados, la máquina tensorial de soporte (STM) para la clasificación de datos tensoriales está recibiendo cada vez más atención en el aprendizaje automático y aplicaciones relacionadas, incluyendo imágenes de teledetección, procesamiento de video, diagnóstico de fallas, etc. Los enfoques STM existentes carecen de consideración de los tensores de soporte en términos de reducción de datos. Para abordar esta deficiencia, construimos un modelo novedoso de STM disperso para controlar el número de tensores de soporte en la clasificación binaria de datos tensoriales. La dispersión se impone en las variables duales en el contexto del espacio de características, lo que facilita la clasificación no lineal con trucos de kernel, como el kernel RBF gaussiano ampliamente utilizado. Para aliviar el riesgo local asociado con el ancho constante en el kernel tensorial RBF gaussiano, proponemos un enfoque de clasificación de dos etapas; en la segunda etapa, abogamos por una estrategia de escalado en la función del kernel de manera dependiente de los datos, utilizando la información de los tensores de soporte obtenidos de la primera etapa. Los modelos de optimización esenciales en ambas etapas comparten el mismo tipo, que es no convexo y discontinuo, debido a la restricción de dispersión. Para resolver el desafío computacional, se adapta un método de Newton de subespacio para la optimización con restricción de dispersión para una computación efectiva con convergencia local. Se realizaron experimentos numéricos en conjuntos de datos reales, y los resultados numéricos demuestran la efectividad de nuestro enfoque de STM disperso de dos etapas propuesto en términos de precisión de clasificación, en comparación con los enfoques de clasificación binaria de vanguardia.