Puntuación de relevancia de atributos: una medida novedosa para identificar la importancia de atributos
Autores: Neirz, Pablo; Allende, Hector; Saavedra, Carolina
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Puntuación de relevancia de atributos: una medida novedosa para identificar la importancia de atributos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Estudiar
Medir
Atribuir relevancia
Modelos de aprendizaje automático
Condiciones de ruido
Modelos predictivos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 22
Citaciones: Sin citaciones
Este estudio introduce una medida novedosa para evaluar la relevancia de atributos, diseñada específicamente para identificar con precisión atributos que están intrínsecamente relacionados con un fenómeno, siendo sensible a la asimetría de esas relaciones y a las condiciones de ruido. Las técnicas tradicionales de selección de variables, como los métodos de filtro y envoltura, a menudo no logran capturar estas complejidades. Nuestra metodología, basada en árboles de decisión pero ampliable a otros modelos de aprendizaje automático, fue evaluada rigurosamente en diversos escenarios de datos. Los resultados demuestran que nuestra medida distingue efectivamente los atributos relevantes de los irrelevantes y resalta cómo la relevancia es influenciada por el ruido, proporcionando una comprensión más matizada en comparación con métodos establecidos como Pearson, Spearman, Kendall, MIC, MAS, MEV, GMIC, y otros. Esta investigación subraya la importancia de la explicabilidad centrada en el fenómeno, la reproducibilidad y la evaluación robusta de la relevancia de atributos en el desarrollo de modelos predictivos. Al mejorar tanto la interpretabilidad como la precisión contextual de los modelos, nuestro enfoque no solo respalda la toma de decisiones más informada, sino que también contribuye a una comprensión más profunda de los mecanismos subyacentes en diversos campos de aplicación, como la investigación biomédica, modelado financiero, astronomía y otros.
Descripción
Este estudio introduce una medida novedosa para evaluar la relevancia de atributos, diseñada específicamente para identificar con precisión atributos que están intrínsecamente relacionados con un fenómeno, siendo sensible a la asimetría de esas relaciones y a las condiciones de ruido. Las técnicas tradicionales de selección de variables, como los métodos de filtro y envoltura, a menudo no logran capturar estas complejidades. Nuestra metodología, basada en árboles de decisión pero ampliable a otros modelos de aprendizaje automático, fue evaluada rigurosamente en diversos escenarios de datos. Los resultados demuestran que nuestra medida distingue efectivamente los atributos relevantes de los irrelevantes y resalta cómo la relevancia es influenciada por el ruido, proporcionando una comprensión más matizada en comparación con métodos establecidos como Pearson, Spearman, Kendall, MIC, MAS, MEV, GMIC, y otros. Esta investigación subraya la importancia de la explicabilidad centrada en el fenómeno, la reproducibilidad y la evaluación robusta de la relevancia de atributos en el desarrollo de modelos predictivos. Al mejorar tanto la interpretabilidad como la precisión contextual de los modelos, nuestro enfoque no solo respalda la toma de decisiones más informada, sino que también contribuye a una comprensión más profunda de los mecanismos subyacentes en diversos campos de aplicación, como la investigación biomédica, modelado financiero, astronomía y otros.