logo móvil
Contáctanos

Procedimiento de Reforzamiento para Aprendizaje Automático Aleatorio

Autores: Popkov, Yuri S.; Dubnov, Yuri A.; Popkov, Alexey Yu.

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Procedimiento de Reforzamiento para Aprendizaje Automático Aleatorio


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Métodos de refuerzo
Aprendizaje automático aleatorizado
Enfoque de agente
Principio de optimalidad de Bellman
Convergencia
Mínimo global

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 39

Citaciones: Sin citaciones


Descripción
Este documento está dedicado a los métodos de refuerzo orientados a problemas para la implementación numérica del Aprendizaje Automático Aleatorio. Hemos desarrollado un esquema del procedimiento de refuerzo basado en el enfoque del agente y el principio de optimalidad de Bellman. Este procedimiento garantiza propiedades estrictamente monótonas de una secuencia de registros locales en el procedimiento computacional iterativo del proceso de aprendizaje. Se determinan las dependencias de las dimensiones del vecindario del mínimo global y la probabilidad de su logro en los parámetros del algoritmo. Se demuestra la convergencia del algoritmo con la probabilidad indicada al vecindario del mínimo global.

Otros recursos que podrían interesarte

Temas Virtualpro