Un método de optimización de informes de prueba que fusiona el aprendizaje por refuerzo y los algoritmos genéticos

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Un método de optimización de informes de prueba que fusiona el aprendizaje por refuerzo y los algoritmos genéticos

Autores: Bai, Ruxue; Chen, Rongshang; Lei, Xiao; Wu, Keshou

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

Un método de optimización de informes de prueba que fusiona el aprendizaje por refuerzo y los algoritmos genéticos

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Filtrado

Informes de defectos

Algoritmos de optimización

Aprendizaje por refuerzo

Algoritmos genéticos

Pruebas con aportaciones de la multitud.

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 34

Citaciones: Sin citaciones

Filtrar informes de defectos de alta variabilidad y alta gravedad de bases de datos de informes de pruebas grandes es una tarea desafiante en el crowdtesting. Los algoritmos de optimización tradicionales basados en técnicas de agrupamiento y distancia han progresado pero están limitados por la configuración de parámetros iniciales y disminuyen significativamente en eficiencia con un número creciente de informes. Para abordar este problema, este documento propone un método que integra el aprendizaje por refuerzo con algoritmos genéticos para la optimización de informes de pruebas crowdsourced, llamado Algoritmo Genético basado en Aprendizaje por Refuerzo para la Optimización de Informes de Pruebas Crowdsourced (RLGA). Su objetivo principal es identificar informes de defectos distintos y de alta gravedad de un conjunto grande. El método utiliza algoritmos genéticos para generar la secuencia óptima de selección de informes y ajusta la probabilidad de cruce (Pc) y la probabilidad de mutación (Pm) dinámicamente con aprendizaje por refuerzo basado en la aptitud promedio de la población, la mejor aptitud y la diversidad. El componente de aprendizaje por refuerzo utiliza una estrategia híbrida SARSA y Q-Learning para actualizar la tabla de valores Q, lo que permite que el algoritmo aprenda rápidamente en las primeras iteraciones y amplíe el espacio de búsqueda posteriormente para evitar óptimos locales, mejorando así la eficiencia. Para validar el método RLGA, este documento utiliza cuatro conjuntos de datos públicos y compara RLGA con seis métodos clásicos. Los resultados indican que RLGA supera a BDDIV en términos de tiempo de ejecución y es menos sensible al número total de informes de prueba. En cuanto a los objetivos de optimización, los informes de prueba seleccionados por RLGA tienen niveles más altos de gravedad de defectos y diversidad que los seleccionados por elección aleatoria, BDDIV y los métodos TSE. En cuanto a la diversidad de la población, RLGA mejora efectivamente la uniformidad y diversidad de individuos en comparación con la inicialización aleatoria. En términos de velocidad de convergencia, RLGA es superior a los métodos GA, GA-SARSA y GA-Q.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro