Análisis empírico de los métodos de selección de características basados en la agregación de rangos en la predicción de defectos de software
Autores: Balogun, Abdullateef O.; Basri, Shuib; Mahamad, Saipunidzam; Abdulkadir, Said Jadid; Capretz, Luiz Fernando; Imam, Abdullahi A.; Almomani, Malek A.; Adeyemo, Victor E.; Kumar, Ganesh
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Análisis empírico de los métodos de selección de características basados en la agregación de rangos en la predicción de defectos de software
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Método de filtro adecuado
Subconjunto de características
Problema de selección de rango de filtro
Selección de características de múltiples filtros basada en la agregación de rangos
Predicción de defectos de software
Alta dimensionalidad
Problema de selección de filtro
Múltiples métodos de filtro
Características computacionales
Lista de rangos agregados
árbol de decisión
Modelos de bayes ingenuos
Conjuntos de datos de defectos
Repositorio de la nasa
Rendimientos de predicción
Métodos de fs experimentados
Modelos de predicción
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 45
Citaciones: Sin citaciones
Seleccionar el método de filtro más adecuado que producirá un subconjunto de características con el mejor rendimiento sigue siendo un problema abierto conocido como el problema de selección de rango de filtro. Una solución viable a este problema es aplicar independientemente una mezcla de métodos de filtro y evaluar los resultados. Este estudio propone métodos novedosos de selección de características de múltiples filtros basados en la agregación de rangos para abordar la alta dimensionalidad y el problema de selección de rango de filtro en la predicción de defectos de software (SDP). Los métodos propuestos combinan listas de rangos generadas por métodos de filtro individuales utilizando mecanismos de agregación de rangos en una sola lista de rangos agregados. Los métodos propuestos tienen como objetivo resolver el problema de selección de filtro utilizando múltiples métodos de filtro con características computacionales diversas para producir una lista de rangos de características disyunta y completa superior a los métodos de rango de filtro individuales. La efectividad del método propuesto fue evaluada con modelos de Árbol de Decisión (DT) y Naïve Bayes (NB) en conjuntos de datos de defectos del repositorio de la NASA. A partir de los resultados experimentales, los métodos propuestos tuvieron un impacto superior (positivo) en el rendimiento de predicción de los modelos NB y DT que otros métodos de FS experimentados. Esto convierte a la combinación de métodos de rango de filtro en una solución viable para el problema de selección de rango de filtro y la mejora de los modelos de predicción en SDP.
Descripción
Seleccionar el método de filtro más adecuado que producirá un subconjunto de características con el mejor rendimiento sigue siendo un problema abierto conocido como el problema de selección de rango de filtro. Una solución viable a este problema es aplicar independientemente una mezcla de métodos de filtro y evaluar los resultados. Este estudio propone métodos novedosos de selección de características de múltiples filtros basados en la agregación de rangos para abordar la alta dimensionalidad y el problema de selección de rango de filtro en la predicción de defectos de software (SDP). Los métodos propuestos combinan listas de rangos generadas por métodos de filtro individuales utilizando mecanismos de agregación de rangos en una sola lista de rangos agregados. Los métodos propuestos tienen como objetivo resolver el problema de selección de filtro utilizando múltiples métodos de filtro con características computacionales diversas para producir una lista de rangos de características disyunta y completa superior a los métodos de rango de filtro individuales. La efectividad del método propuesto fue evaluada con modelos de Árbol de Decisión (DT) y Naïve Bayes (NB) en conjuntos de datos de defectos del repositorio de la NASA. A partir de los resultados experimentales, los métodos propuestos tuvieron un impacto superior (positivo) en el rendimiento de predicción de los modelos NB y DT que otros métodos de FS experimentados. Esto convierte a la combinación de métodos de rango de filtro en una solución viable para el problema de selección de rango de filtro y la mejora de los modelos de predicción en SDP.