logo móvil
Contáctanos

Sintonizar los pesos: el impacto de las configuraciones iniciales de la matriz en la eficacia del aprendizaje de características sucesoras

Autores: Lee, Hyunsu

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Sintonizar los pesos: el impacto de las configuraciones iniciales de la matriz en la eficacia del aprendizaje de características sucesoras


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Impacto
Estrategias de inicialización
Matriz de pesos
Aprendizaje por refuerzo
Eficiencia
Convergencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
El enfoque de este estudio es investigar el impacto de diferentes estrategias de inicialización para la matriz de peso de Características Sucesoras (SF) en la eficiencia de aprendizaje y convergencia en agentes de Aprendizaje por Refuerzo (RL). Utilizando un paradigma de mundo de cuadrícula, comparamos el rendimiento de agentes de RL, cuya matriz de peso de SF se inicializa con una matriz de identidad, matriz de ceros, o una matriz generada aleatoriamente (usando el método de distribución Xavier, He, o uniforme). Nuestro análisis se centra en evaluar métricas como el error de valor, longitud de paso, PCA de la representación sucesora (SR) del campo de lugar, y la distancia de las matrices de SR entre diferentes agentes. Los resultados demuestran que los agentes de RL inicializados con matrices aleatorias alcanzan el campo de lugar de SR óptimo más rápido y muestran una reducción más rápida en el error de valor, lo que apunta a un aprendizaje más eficiente. Además, estos agentes aleatorios también muestran una disminución más rápida en la longitud de paso en entornos de mundo de cuadrícula más grandes. El estudio proporciona ideas sobre las interpretaciones neurobiológicas de estos resultados, sus implicaciones para comprender la inteligencia, y posibles direcciones para futuras investigaciones. Estos hallazgos podrían tener profundas implicaciones para el campo de la inteligencia artificial, especialmente en el diseño de algoritmos de aprendizaje.

Otros recursos que podrían interesarte

Temas Virtualpro