Una máquina de regresión de soporte vectorial ponderada por características basada en el criterio de independencia de Hilbert-Schmidt, operador de selección y reducción de la mínima absoluta
Autores: Zhang, Xin; Wang, Tinghua; Lai, Zhiyong
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Una máquina de regresión de soporte vectorial ponderada por características basada en el criterio de independencia de Hilbert-Schmidt, operador de selección y reducción de la mínima absoluta
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Regresión de vectores de soporte
Ponderación de características
HSIC LASSO
Métodos de medición de correlación
Contribución de características
Rendimiento predictivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La regresión por vectores de soporte (SVR) es un potente algoritmo de predicción de regresión basado en núcleos que funciona excelentemente en varios escenarios de aplicación. Sin embargo, para datos del mundo real, el SVR general a menudo no logra un buen rendimiento predictivo debido a su incapacidad para evaluar con precisión la contribución de las características. La ponderación de características es una solución adecuada para abordar este problema, aplicando métodos de medición de correlación para obtener pesos razonables para las características en función de sus contribuciones a la salida. En este artículo, basado en la idea de un operador de selección y reducción absoluta mínima de criterio de independencia de Hilbert-Schmidt (HSIC LASSO) para seleccionar características con mínima redundancia y máxima relevancia, proponemos un nuevo SVR ponderado por características que considera la importancia de las características para la salida y la redundancia entre características. En este enfoque, se utiliza el HSIC para medir de manera efectiva la correlación entre características, así como entre características y la salida. Los pesos de las características se obtienen resolviendo un problema de regresión LASSO. En comparación con otros métodos de ponderación de características, nuestro método considera de manera mucho más integral el cálculo de pesos, y la función de núcleo ponderada obtenida puede llevar a predicciones más precisas para datos desconocidos. Experimentos exhaustivos en conjuntos de datos reales del repositorio de aprendizaje automático de la Universidad de California en Irvine (UCI) demuestran la efectividad del método propuesto.
Descripción
La regresión por vectores de soporte (SVR) es un potente algoritmo de predicción de regresión basado en núcleos que funciona excelentemente en varios escenarios de aplicación. Sin embargo, para datos del mundo real, el SVR general a menudo no logra un buen rendimiento predictivo debido a su incapacidad para evaluar con precisión la contribución de las características. La ponderación de características es una solución adecuada para abordar este problema, aplicando métodos de medición de correlación para obtener pesos razonables para las características en función de sus contribuciones a la salida. En este artículo, basado en la idea de un operador de selección y reducción absoluta mínima de criterio de independencia de Hilbert-Schmidt (HSIC LASSO) para seleccionar características con mínima redundancia y máxima relevancia, proponemos un nuevo SVR ponderado por características que considera la importancia de las características para la salida y la redundancia entre características. En este enfoque, se utiliza el HSIC para medir de manera efectiva la correlación entre características, así como entre características y la salida. Los pesos de las características se obtienen resolviendo un problema de regresión LASSO. En comparación con otros métodos de ponderación de características, nuestro método considera de manera mucho más integral el cálculo de pesos, y la función de núcleo ponderada obtenida puede llevar a predicciones más precisas para datos desconocidos. Experimentos exhaustivos en conjuntos de datos reales del repositorio de aprendizaje automático de la Universidad de California en Irvine (UCI) demuestran la efectividad del método propuesto.