Integrando aprendizaje por refuerzo averso al riesgo y restringido para la toma de decisiones robusta en escenarios de alto riesgo
Autores: Ahmad, Moiz; Ramzan, Muhammad Babar; Omair, Muhammad; Habib, Muhammad Salman
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Integrando aprendizaje por refuerzo averso al riesgo y restringido para la toma de decisiones robusta en escenarios de alto riesgo
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Proceso de decisión de Markov
Aversión al riesgo
Robustez
Respuesta ante desastres
Dualidad
Aprendizaje por refuerzo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 21
Citaciones: Sin citaciones
Este documento considera un proceso de decisión de Markov (MDP) averso al riesgo con restricciones no riesgosas como un marco de optimización dinámica para garantizar la robustez contra resultados desfavorables en situaciones de toma de decisiones secuenciales de alto riesgo, como la respuesta a desastres.
Descripción
Este documento considera un proceso de decisión de Markov (MDP) averso al riesgo con restricciones no riesgosas como un marco de optimización dinámica para garantizar la robustez contra resultados desfavorables en situaciones de toma de decisiones secuenciales de alto riesgo, como la respuesta a desastres.