Modelando la Teoría de la Mente en Juegos Diádicos Usando Control de Retroalimentación Adaptativo
Autores: Freire, Ismael T.; Arsiwalla, Xerxes D.; Puigbò, Jordi-Ysard; Verschure, Paul
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Modelando la Teoría de la Mente en Juegos Diádicos Usando Control de Retroalimentación Adaptativo
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Desafío
Agentes autónomos inteligentes
Comportamiento
Estados mentales
Interacciones sociales
Teoría de la Mente
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Un desafío importante en la ciencia cognitiva y la IA ha sido entender cómo los agentes autónomos inteligentes podrían adquirir y predecir los estados de comportamiento y mentales de otros agentes en el transcurso de interacciones sociales complejas. ¿Cómo modela un agente así los objetivos, creencias y acciones de otros agentes con los que interactúa? ¿Cuáles son los principios computacionales para modelar una Teoría de la Mente (ToM)? Los enfoques de aprendizaje profundo para abordar estas preguntas no logran una mejor comprensión del problema. En parte, esto se debe a la naturaleza de caja negra de las redes profundas, donde los mecanismos computacionales de la ToM no se revelan fácilmente. Aquí, consideramos hipótesis alternativas que buscan modelar cómo el cerebro podría realizar una ToM. En particular, proponemos modelos de agentes incorporados y situados basados en la teoría del control adaptativo distribuido para predecir las acciones de otros agentes en cinco tareas diferentes de teoría de juegos (Juego de la Armonía, Halcón y Paloma, Caza del Ciervo, Dilema del Prisionero y Batalla de los Ex). Nuestros modelos de control de múltiples capas implementan predicciones de arriba hacia abajo desde capas de control adaptativas a reactivas y retroalimentación de error de abajo hacia arriba desde capas reactivas a adaptativas. Probamos estrategias cooperativas y competitivas entre siete modelos de agentes diferentes (cooperativo, codicioso, ojo por ojo, basado en refuerzo, racional, predictivo y agentes internos). Mostramos que, en comparación con estrategias puramente basadas en refuerzo, los agentes de aprendizaje probabilístico modelados en fenotipos racionales, predictivos e internos tienen un mejor desempeño en métricas de teoría de juegos a través de las tareas. Los modelos autónomos de múltiples agentes descritos podrían capturar procesos a nivel de sistemas subyacentes a una ToM y sugerir principios arquitectónicos de la ToM desde una perspectiva de teoría de control.
Descripción
Un desafío importante en la ciencia cognitiva y la IA ha sido entender cómo los agentes autónomos inteligentes podrían adquirir y predecir los estados de comportamiento y mentales de otros agentes en el transcurso de interacciones sociales complejas. ¿Cómo modela un agente así los objetivos, creencias y acciones de otros agentes con los que interactúa? ¿Cuáles son los principios computacionales para modelar una Teoría de la Mente (ToM)? Los enfoques de aprendizaje profundo para abordar estas preguntas no logran una mejor comprensión del problema. En parte, esto se debe a la naturaleza de caja negra de las redes profundas, donde los mecanismos computacionales de la ToM no se revelan fácilmente. Aquí, consideramos hipótesis alternativas que buscan modelar cómo el cerebro podría realizar una ToM. En particular, proponemos modelos de agentes incorporados y situados basados en la teoría del control adaptativo distribuido para predecir las acciones de otros agentes en cinco tareas diferentes de teoría de juegos (Juego de la Armonía, Halcón y Paloma, Caza del Ciervo, Dilema del Prisionero y Batalla de los Ex). Nuestros modelos de control de múltiples capas implementan predicciones de arriba hacia abajo desde capas de control adaptativas a reactivas y retroalimentación de error de abajo hacia arriba desde capas reactivas a adaptativas. Probamos estrategias cooperativas y competitivas entre siete modelos de agentes diferentes (cooperativo, codicioso, ojo por ojo, basado en refuerzo, racional, predictivo y agentes internos). Mostramos que, en comparación con estrategias puramente basadas en refuerzo, los agentes de aprendizaje probabilístico modelados en fenotipos racionales, predictivos e internos tienen un mejor desempeño en métricas de teoría de juegos a través de las tareas. Los modelos autónomos de múltiples agentes descritos podrían capturar procesos a nivel de sistemas subyacentes a una ToM y sugerir principios arquitectónicos de la ToM desde una perspectiva de teoría de control.