Modelos de Transformadores Explicables para el Reconocimiento de Emociones Humanas: Un Estudio de Explicabilidad de Múltiples Métodos en el Contexto de la Salud Mental
Autores: Azhar, Muhammad; Riaz, Naureen; Azeem, Waqar; Dewi, Deshinta Arrova; Amjad, Adeen; Arman, Muhammad
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Modelos de Transformadores Explicables para el Reconocimiento de Emociones Humanas: Un Estudio de Explicabilidad de Múltiples Métodos en el Contexto de la Salud Mental
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Identificar emociones
Procesamiento de lenguaje natural
Reconocimiento de emociones explicable
Técnicas de inteligencia artificial
Transparencia del modelo
Sistemas de apoyo a la salud mental
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La capacidad de identificar emociones basadas en texto escrito es una de las áreas centrales del Procesamiento de Lenguaje Natural (NLP) y tiene muchas aplicaciones en áreas como el monitoreo de la salud mental, el análisis de sentimientos y los sistemas de diálogo. Este estudio propone un marco de reconocimiento de emociones explicable (EER) construido sobre un modelo RoBERTa-base ajustado, entrenado en el conjunto de datos Emotions for NLP, con una precisión del 92.4% y una puntuación F1 ponderada del 92.5%. Para interpretar el proceso de decisión del modelo EER, aplicamos sistemáticamente cuatro técnicas complementarias de inteligencia artificial explicable (XAI) para proporcionar explicaciones y perspectivas sobre cómo el modelo realiza sus predicciones: SHAP para la atribución de características a nivel de token global, LIME para explicaciones a nivel de instancia local, visualización de atención multi-cabeza para la interpretabilidad estructural, y gradientes integrados a través de Captum para la atribución basada en gradientes que satisface axiomas. Cada uno de estos cuatro métodos proporciona vistas complementarias desde múltiples perspectivas del comportamiento del modelo EER, lo que puede ayudar a aumentar la transparencia del modelo, identificar sesgos potenciales y permitir el uso responsable de modelos basados en transformadores en entornos críticos (por ejemplo, aquellos que requieren documentación clínica formal). Nuestros experimentos muestran consistentemente que el modelo EER identifica tokens como los que tienen el nivel más alto de expresión emocional como la característica predictiva más fuerte desde perspectivas metodológicas, con evidencia sólida de acuerdo entre metodologías respecto a la coherencia semántica de las representaciones aprendidas. Nuestros hallazgos tienen implicaciones directas para la implementación responsable de sistemas de reconocimiento de emociones basados en IA en sistemas de apoyo a la salud mental, donde la transparencia de la interfaz de usuario del modelo, la mitigación de sesgos y la confianza clínica son necesarias para garantizar una atención de calidad al paciente.
Descripción
La capacidad de identificar emociones basadas en texto escrito es una de las áreas centrales del Procesamiento de Lenguaje Natural (NLP) y tiene muchas aplicaciones en áreas como el monitoreo de la salud mental, el análisis de sentimientos y los sistemas de diálogo. Este estudio propone un marco de reconocimiento de emociones explicable (EER) construido sobre un modelo RoBERTa-base ajustado, entrenado en el conjunto de datos Emotions for NLP, con una precisión del 92.4% y una puntuación F1 ponderada del 92.5%. Para interpretar el proceso de decisión del modelo EER, aplicamos sistemáticamente cuatro técnicas complementarias de inteligencia artificial explicable (XAI) para proporcionar explicaciones y perspectivas sobre cómo el modelo realiza sus predicciones: SHAP para la atribución de características a nivel de token global, LIME para explicaciones a nivel de instancia local, visualización de atención multi-cabeza para la interpretabilidad estructural, y gradientes integrados a través de Captum para la atribución basada en gradientes que satisface axiomas. Cada uno de estos cuatro métodos proporciona vistas complementarias desde múltiples perspectivas del comportamiento del modelo EER, lo que puede ayudar a aumentar la transparencia del modelo, identificar sesgos potenciales y permitir el uso responsable de modelos basados en transformadores en entornos críticos (por ejemplo, aquellos que requieren documentación clínica formal). Nuestros experimentos muestran consistentemente que el modelo EER identifica tokens como los que tienen el nivel más alto de expresión emocional como la característica predictiva más fuerte desde perspectivas metodológicas, con evidencia sólida de acuerdo entre metodologías respecto a la coherencia semántica de las representaciones aprendidas. Nuestros hallazgos tienen implicaciones directas para la implementación responsable de sistemas de reconocimiento de emociones basados en IA en sistemas de apoyo a la salud mental, donde la transparencia de la interfaz de usuario del modelo, la mitigación de sesgos y la confianza clínica son necesarias para garantizar una atención de calidad al paciente.