Sintonizar los pesos: el impacto de las configuraciones iniciales de la matriz en la eficacia del aprendizaje de características sucesoras

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Sintonizar los pesos: el impacto de las configuraciones iniciales de la matriz en la eficacia del aprendizaje de características sucesoras

Autores: Lee, Hyunsu

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico

2023

Sintonizar los pesos: el impacto de las configuraciones iniciales de la matriz en la eficacia del aprendizaje de características sucesoras

Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Impacto

Estrategias de inicialización

Matriz de pesos

Aprendizaje por refuerzo

Eficiencia

Convergencia

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones

El enfoque de este estudio es investigar el impacto de diferentes estrategias de inicialización para la matriz de peso de Características Sucesoras (SF) en la eficiencia de aprendizaje y convergencia en agentes de Aprendizaje por Refuerzo (RL). Utilizando un paradigma de mundo de cuadrícula, comparamos el rendimiento de agentes de RL, cuya matriz de peso de SF se inicializa con una matriz de identidad, matriz de ceros, o una matriz generada aleatoriamente (usando el método de distribución Xavier, He, o uniforme). Nuestro análisis se centra en evaluar métricas como el error de valor, longitud de paso, PCA de la representación sucesora (SR) del campo de lugar, y la distancia de las matrices de SR entre diferentes agentes. Los resultados demuestran que los agentes de RL inicializados con matrices aleatorias alcanzan el campo de lugar de SR óptimo más rápido y muestran una reducción más rápida en el error de valor, lo que apunta a un aprendizaje más eficiente. Además, estos agentes aleatorios también muestran una disminución más rápida en la longitud de paso en entornos de mundo de cuadrícula más grandes. El estudio proporciona ideas sobre las interpretaciones neurobiológicas de estos resultados, sus implicaciones para comprender la inteligencia, y posibles direcciones para futuras investigaciones. Estos hallazgos podrían tener profundas implicaciones para el campo de la inteligencia artificial, especialmente en el diseño de algoritmos de aprendizaje.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro