logo móvil
Contáctanos

¿Puede el aprendizaje por refuerzo interpretable gestionar la prosperidad a tu manera?

Autores: Maree, Charl; Omlin, Christian W.

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

¿Puede el aprendizaje por refuerzo interpretable gestionar la prosperidad a tu manera?


Categoría

Ingeniería y Tecnología

Subcategoría

Inteligencia Artificial

Palabras clave

Personalización
Aprendizaje automático
Aprendizaje por refuerzo
Explicabilidad del modelo
Interpretabilidad
Toma de decisiones financieras

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 24

Citaciones: Sin citaciones


Descripción
La personalización de productos y servicios se está convirtiendo rápidamente en el motor del éxito en la banca y el comercio. El aprendizaje automático promete obtener una comprensión más profunda y adaptarse a las necesidades y preferencias de los clientes. Mientras que las soluciones tradicionales a los problemas financieros suelen depender de suposiciones de modelo, el aprendizaje por refuerzo puede aprovechar grandes cantidades de datos para mejorar la modelización de clientes y la toma de decisiones en entornos financieros complejos con menos suposiciones. La explicabilidad e interpretabilidad del modelo presentan desafíos desde una perspectiva regulatoria que exige transparencia para su aceptación; también ofrecen la oportunidad de obtener una mejor visión y comprensión de los clientes. Los enfoques post-hoc se utilizan típicamente para explicar modelos de aprendizaje por refuerzo preentrenados. Basándonos en nuestro modelado previo del comportamiento de gasto de los clientes, adaptamos nuestro algoritmo reciente de aprendizaje por refuerzo que caracteriza intrínsecamente comportamientos deseables y transitamos al problema de la gestión de la prosperidad. Entrenamos agentes de aprendizaje por refuerzo inherentemente interpretables para dar consejos de inversión que se alinean con los rasgos prototípicos de personalidad financiera, que se combinan para hacer una recomendación final. Observamos que los consejos de los agentes entrenados se adhieren a sus características previstas, aprenden el valor del crecimiento compuesto y, sin ninguna referencia explícita, la noción de riesgo, así como una convergencia de políticas mejorada.

Otros recursos que podrían interesarte

Temas Virtualpro