logo móvil
Contáctanos

Una Evaluación de la Robustez de la Selección de Características en Datos Ruidosos de Clase

Autores: Pau, Simone; Perniciano, Alessandra; Pes, Barbara; Rubattu, Dario

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Una Evaluación de la Robustez de la Selección de Características en Datos Ruidosos de Clase


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Selección de características
Aprendizaje automático
Minería de datos
Instancias ruidosas
Ruido de clase
Conjuntos de datos de alta dimensión

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Con el creciente aumento de la dimensionalidad de los datos, la selección de características se ha convertido en un paso crucial en una variedad de aplicaciones de aprendizaje automático y minería de datos. De hecho, permite identificar los atributos más importantes de la tarea en cuestión, mejorando la eficiencia, la interpretabilidad y el rendimiento final de los modelos inducidos. En la literatura reciente, varios estudios han examinado las fortalezas y debilidades de los métodos de selección de características disponibles desde diferentes puntos de vista. Sin embargo, se ha realizado poco trabajo para investigar cuán sensibles son a la presencia de instancias ruidosas en los datos de entrada. Este es el campo específico en el que nuestro trabajo quiere hacer una contribución. De hecho, dado que el ruido es, sin duda, inevitable en varios escenarios de aplicación, sería importante entender hasta qué punto las diferentes heurísticas de selección pueden verse afectadas por el ruido, en particular el ruido de clase (que es más perjudicial en tareas de aprendizaje supervisado). Tal evaluación puede ser especialmente importante en el contexto de problemas de clase desbalanceada, donde cualquier perturbación en el conjunto de registros de entrenamiento puede afectar fuertemente el resultado final de la selección. En este sentido, aquí proporcionamos una contribución doble al presentar (i) una metodología general para evaluar la robustez de la selección de características en datos ruidosos de clase y (ii) un estudio experimental que involucra diferentes métodos de selección, tanto univariantes como multivariantes. Los experimentos se han llevado a cabo en ocho conjuntos de datos de alta dimensionalidad elegidos para ser representativos de diferentes dominios del mundo real, con interesantes perspectivas sobre el grado intrínseco de robustez de los enfoques de selección considerados.

Otros recursos que podrían interesarte

Temas Virtualpro