Un método de selección de características basado en instancias y etiquetas en tareas de clasificación
Autores: Fan, Qingcheng; Liu, Sicong; Zhao, Chunjiang; Li, Shuqin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un método de selección de características basado en instancias y etiquetas en tareas de clasificación
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Selección de características
Tareas de clasificación
Coeficientes de correlación
Correlación de etiquetas
Dimensionalidad de datos
Rendimiento del modelo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La selección de características es crucial en las tareas de clasificación, ya que ayuda a extraer información relevante mientras se reduce la redundancia. Este artículo presenta un método novedoso que considera tanto la correlación entre instancias como entre etiquetas. Al emplear el método de mínimos cuadrados, calculamos la relación lineal entre cada característica y la variable objetivo, lo que resulta en coeficientes de correlación. Se seleccionan características con altos coeficientes de correlación. En comparación con los métodos tradicionales, nuestro enfoque ofrece dos ventajas. En primer lugar, selecciona de manera efectiva características altamente correlacionadas con la variable objetivo de un gran conjunto de características, reduciendo la dimensionalidad de los datos y mejorando la eficiencia del análisis y modelado. En segundo lugar, nuestro método considera la correlación entre etiquetas de las características, mejorando la precisión de las características seleccionadas y el rendimiento del modelo subsiguiente. Los resultados experimentales en tres conjuntos de datos demuestran la efectividad de nuestro método para seleccionar características con altos coeficientes de correlación, lo que conduce a un rendimiento superior del modelo. Notablemente, nuestro enfoque logra una mejora mínima de precisión del 3.2% para el clasificador avanzado, lightGBM, superando otros métodos de selección de características. En resumen, nuestro método propuesto, basado en la correlación entre instancias y etiquetas, presenta una solución adecuada para problemas de clasificación.
Descripción
La selección de características es crucial en las tareas de clasificación, ya que ayuda a extraer información relevante mientras se reduce la redundancia. Este artículo presenta un método novedoso que considera tanto la correlación entre instancias como entre etiquetas. Al emplear el método de mínimos cuadrados, calculamos la relación lineal entre cada característica y la variable objetivo, lo que resulta en coeficientes de correlación. Se seleccionan características con altos coeficientes de correlación. En comparación con los métodos tradicionales, nuestro enfoque ofrece dos ventajas. En primer lugar, selecciona de manera efectiva características altamente correlacionadas con la variable objetivo de un gran conjunto de características, reduciendo la dimensionalidad de los datos y mejorando la eficiencia del análisis y modelado. En segundo lugar, nuestro método considera la correlación entre etiquetas de las características, mejorando la precisión de las características seleccionadas y el rendimiento del modelo subsiguiente. Los resultados experimentales en tres conjuntos de datos demuestran la efectividad de nuestro método para seleccionar características con altos coeficientes de correlación, lo que conduce a un rendimiento superior del modelo. Notablemente, nuestro enfoque logra una mejora mínima de precisión del 3.2% para el clasificador avanzado, lightGBM, superando otros métodos de selección de características. En resumen, nuestro método propuesto, basado en la correlación entre instancias y etiquetas, presenta una solución adecuada para problemas de clasificación.