Procedimiento de Reforzamiento para Aprendizaje Automático Aleatorio
Autores: Popkov, Yuri S.; Dubnov, Yuri A.; Popkov, Alexey Yu.
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Procedimiento de Reforzamiento para Aprendizaje Automático Aleatorio
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Métodos de refuerzo
Aprendizaje automático aleatorizado
Enfoque de agente
Principio de optimalidad de Bellman
Convergencia
Mínimo global
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 39
Citaciones: Sin citaciones
Este documento está dedicado a los métodos de refuerzo orientados a problemas para la implementación numérica del Aprendizaje Automático Aleatorio. Hemos desarrollado un esquema del procedimiento de refuerzo basado en el enfoque del agente y el principio de optimalidad de Bellman. Este procedimiento garantiza propiedades estrictamente monótonas de una secuencia de registros locales en el procedimiento computacional iterativo del proceso de aprendizaje. Se determinan las dependencias de las dimensiones del vecindario del mínimo global y la probabilidad de su logro en los parámetros del algoritmo. Se demuestra la convergencia del algoritmo con la probabilidad indicada al vecindario del mínimo global.
Descripción
Este documento está dedicado a los métodos de refuerzo orientados a problemas para la implementación numérica del Aprendizaje Automático Aleatorio. Hemos desarrollado un esquema del procedimiento de refuerzo basado en el enfoque del agente y el principio de optimalidad de Bellman. Este procedimiento garantiza propiedades estrictamente monótonas de una secuencia de registros locales en el procedimiento computacional iterativo del proceso de aprendizaje. Se determinan las dependencias de las dimensiones del vecindario del mínimo global y la probabilidad de su logro en los parámetros del algoritmo. Se demuestra la convergencia del algoritmo con la probabilidad indicada al vecindario del mínimo global.