Máquinas de soporte vectorial adaptativas a datos basadas en kernel para clasificación multi-clase
Autores: Shao, Jianli; Liu, Xin; He, Wenqing
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Máquinas de soporte vectorial adaptativas a datos basadas en kernel para clasificación multi-clase
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Datos desequilibrados
Máquina de vectores de soporte
SVM
Clasificación multiclase
SVM adaptativa a los datos
Funciones de kernel
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
Los datos desequilibrados existen en muchos problemas de clasificación. La clasificación de datos desequilibrados presenta desafíos notables en el aprendizaje automático. La máquina de vectores de soporte (SVM) y sus variantes son populares en el aprendizaje automático entre diferentes clasificadores gracias a su flexibilidad e interpretabilidad. Sin embargo, el rendimiento de las SVM se ve afectado cuando los datos están desequilibrados, lo cual es una estructura de datos típica en el problema de clasificación multi-categoría. En este documento, empleamos la SVM adaptativa a los datos con funciones de kernel escaladas para clasificar instancias de una población multi-clase. Proponemos una función de kernel dependiente de los datos para la SVM considerando el desequilibrio de clases y la asociación espacial entre instancias para mejorar la precisión de la clasificación. Los estudios de simulación demuestran el excelente rendimiento del método propuesto, y se emplea un conjunto de datos de imágenes de cáncer de próstata multi-clase reales como ilustración. El método propuesto no solo supera a los métodos competidores en términos de las medidas de precisión comúnmente utilizadas como el puntaje F1 y los -means, sino que también detecta con éxito más del 60% de las instancias de la clase rara en los datos reales, mientras que los competidores solo pueden detectar menos del 20% de las instancias de la clase rara. El método propuesto beneficiará a otros campos de investigación científica, como la detección de límites de múltiples regiones.
Descripción
Los datos desequilibrados existen en muchos problemas de clasificación. La clasificación de datos desequilibrados presenta desafíos notables en el aprendizaje automático. La máquina de vectores de soporte (SVM) y sus variantes son populares en el aprendizaje automático entre diferentes clasificadores gracias a su flexibilidad e interpretabilidad. Sin embargo, el rendimiento de las SVM se ve afectado cuando los datos están desequilibrados, lo cual es una estructura de datos típica en el problema de clasificación multi-categoría. En este documento, empleamos la SVM adaptativa a los datos con funciones de kernel escaladas para clasificar instancias de una población multi-clase. Proponemos una función de kernel dependiente de los datos para la SVM considerando el desequilibrio de clases y la asociación espacial entre instancias para mejorar la precisión de la clasificación. Los estudios de simulación demuestran el excelente rendimiento del método propuesto, y se emplea un conjunto de datos de imágenes de cáncer de próstata multi-clase reales como ilustración. El método propuesto no solo supera a los métodos competidores en términos de las medidas de precisión comúnmente utilizadas como el puntaje F1 y los -means, sino que también detecta con éxito más del 60% de las instancias de la clase rara en los datos reales, mientras que los competidores solo pueden detectar menos del 20% de las instancias de la clase rara. El método propuesto beneficiará a otros campos de investigación científica, como la detección de límites de múltiples regiones.