Un método de optimización de informes de prueba que fusiona el aprendizaje por refuerzo y los algoritmos genéticos
Autores: Bai, Ruxue; Chen, Rongshang; Lei, Xiao; Wu, Keshou
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Un método de optimización de informes de prueba que fusiona el aprendizaje por refuerzo y los algoritmos genéticos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Filtrado
Informes de defectos
Algoritmos de optimización
Aprendizaje por refuerzo
Algoritmos genéticos
Pruebas con aportaciones de la multitud.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Filtrar informes de defectos de alta variabilidad y alta gravedad de bases de datos de informes de pruebas grandes es una tarea desafiante en el crowdtesting. Los algoritmos de optimización tradicionales basados en técnicas de agrupamiento y distancia han progresado pero están limitados por la configuración de parámetros iniciales y disminuyen significativamente en eficiencia con un número creciente de informes. Para abordar este problema, este documento propone un método que integra el aprendizaje por refuerzo con algoritmos genéticos para la optimización de informes de pruebas crowdsourced, llamado Algoritmo Genético basado en Aprendizaje por Refuerzo para la Optimización de Informes de Pruebas Crowdsourced (RLGA). Su objetivo principal es identificar informes de defectos distintos y de alta gravedad de un conjunto grande. El método utiliza algoritmos genéticos para generar la secuencia óptima de selección de informes y ajusta la probabilidad de cruce (Pc) y la probabilidad de mutación (Pm) dinámicamente con aprendizaje por refuerzo basado en la aptitud promedio de la población, la mejor aptitud y la diversidad. El componente de aprendizaje por refuerzo utiliza una estrategia híbrida SARSA y Q-Learning para actualizar la tabla de valores Q, lo que permite que el algoritmo aprenda rápidamente en las primeras iteraciones y amplíe el espacio de búsqueda posteriormente para evitar óptimos locales, mejorando así la eficiencia. Para validar el método RLGA, este documento utiliza cuatro conjuntos de datos públicos y compara RLGA con seis métodos clásicos. Los resultados indican que RLGA supera a BDDIV en términos de tiempo de ejecución y es menos sensible al número total de informes de prueba. En cuanto a los objetivos de optimización, los informes de prueba seleccionados por RLGA tienen niveles más altos de gravedad de defectos y diversidad que los seleccionados por elección aleatoria, BDDIV y los métodos TSE. En cuanto a la diversidad de la población, RLGA mejora efectivamente la uniformidad y diversidad de individuos en comparación con la inicialización aleatoria. En términos de velocidad de convergencia, RLGA es superior a los métodos GA, GA-SARSA y GA-Q.
Descripción
Filtrar informes de defectos de alta variabilidad y alta gravedad de bases de datos de informes de pruebas grandes es una tarea desafiante en el crowdtesting. Los algoritmos de optimización tradicionales basados en técnicas de agrupamiento y distancia han progresado pero están limitados por la configuración de parámetros iniciales y disminuyen significativamente en eficiencia con un número creciente de informes. Para abordar este problema, este documento propone un método que integra el aprendizaje por refuerzo con algoritmos genéticos para la optimización de informes de pruebas crowdsourced, llamado Algoritmo Genético basado en Aprendizaje por Refuerzo para la Optimización de Informes de Pruebas Crowdsourced (RLGA). Su objetivo principal es identificar informes de defectos distintos y de alta gravedad de un conjunto grande. El método utiliza algoritmos genéticos para generar la secuencia óptima de selección de informes y ajusta la probabilidad de cruce (Pc) y la probabilidad de mutación (Pm) dinámicamente con aprendizaje por refuerzo basado en la aptitud promedio de la población, la mejor aptitud y la diversidad. El componente de aprendizaje por refuerzo utiliza una estrategia híbrida SARSA y Q-Learning para actualizar la tabla de valores Q, lo que permite que el algoritmo aprenda rápidamente en las primeras iteraciones y amplíe el espacio de búsqueda posteriormente para evitar óptimos locales, mejorando así la eficiencia. Para validar el método RLGA, este documento utiliza cuatro conjuntos de datos públicos y compara RLGA con seis métodos clásicos. Los resultados indican que RLGA supera a BDDIV en términos de tiempo de ejecución y es menos sensible al número total de informes de prueba. En cuanto a los objetivos de optimización, los informes de prueba seleccionados por RLGA tienen niveles más altos de gravedad de defectos y diversidad que los seleccionados por elección aleatoria, BDDIV y los métodos TSE. En cuanto a la diversidad de la población, RLGA mejora efectivamente la uniformidad y diversidad de individuos en comparación con la inicialización aleatoria. En términos de velocidad de convergencia, RLGA es superior a los métodos GA, GA-SARSA y GA-Q.