logo móvil
Contáctanos

Integrando aprendizaje por refuerzo averso al riesgo y restringido para la toma de decisiones robusta en escenarios de alto riesgo

Autores: Ahmad, Moiz; Ramzan, Muhammad Babar; Omair, Muhammad; Habib, Muhammad Salman

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Integrando aprendizaje por refuerzo averso al riesgo y restringido para la toma de decisiones robusta en escenarios de alto riesgo


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Proceso de decisión de Markov
Aversión al riesgo
Robustez
Respuesta ante desastres
Dualidad
Aprendizaje por refuerzo

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 21

Citaciones: Sin citaciones


Descripción
Este documento considera un proceso de decisión de Markov (MDP) averso al riesgo con restricciones no riesgosas como un marco de optimización dinámica para garantizar la robustez contra resultados desfavorables en situaciones de toma de decisiones secuenciales de alto riesgo, como la respuesta a desastres.

Otros recursos que podrían interesarte

Temas Virtualpro