Duración asintótica para problemas óptimos de múltiples paradas
Autores: Entwistle, Hugh N.; Lustri, Christopher J.; Sofronov, Georgy Yu.
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Duración asintótica para problemas óptimos de múltiples paradas
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Duración asintótica
Problemas de parada óptima
Variables aleatorias independientes
Distribución continua
Estrategia óptima
Recompensa esperada
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
Estudiamos la duración asintótica de problemas de parada óptima que involucran una secuencia de variables aleatorias independientes que se extraen de una distribución continua conocida. Estas variables se observan como una secuencia, donde no se permite recordar observaciones anteriores, y el objetivo es formar una estrategia óptima para maximizar la recompensa esperada. En nuestro trabajo anterior, presentamos una metodología, utilizando técnicas de matemáticas aplicadas, para obtener expresiones asintóticas para la duración esperada del tiempo de parada óptimo donde se permite una parada. En este estudio, generalizamos aún más al caso donde se permite más de una parada, con una función objetivo actualizada de maximizar la suma esperada de las variables elegidas. Formulamos una generalización completa para una familia exponencial, así como la distribución uniforme utilizando un enfoque inductivo en la formulación de la regla de parada. Se muestran ejemplos explícitos para funciones de probabilidad comunes, así como simulaciones para verificar los cálculos asintóticos.
Descripción
Estudiamos la duración asintótica de problemas de parada óptima que involucran una secuencia de variables aleatorias independientes que se extraen de una distribución continua conocida. Estas variables se observan como una secuencia, donde no se permite recordar observaciones anteriores, y el objetivo es formar una estrategia óptima para maximizar la recompensa esperada. En nuestro trabajo anterior, presentamos una metodología, utilizando técnicas de matemáticas aplicadas, para obtener expresiones asintóticas para la duración esperada del tiempo de parada óptimo donde se permite una parada. En este estudio, generalizamos aún más al caso donde se permite más de una parada, con una función objetivo actualizada de maximizar la suma esperada de las variables elegidas. Formulamos una generalización completa para una familia exponencial, así como la distribución uniforme utilizando un enfoque inductivo en la formulación de la regla de parada. Se muestran ejemplos explícitos para funciones de probabilidad comunes, así como simulaciones para verificar los cálculos asintóticos.