Un Estudio Empírico de BERT Federado para el Análisis de Sentimientos Descentralizado en Twitter
Autores: Louzar, Oumaima; Elbaghdadi, Abdelaziz; El Oualkadi, Ahmed; Baida, Ouafae; Lyhyaoui, Abdelouahid
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Un Estudio Empírico de BERT Federado para el Análisis de Sentimientos Descentralizado en Twitter
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Plataforma
Privacidad
Aprendizaje federado
Modelo BERT
Análisis de sentimientos
Descentralizado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Twitter/x se ha convertido en una plataforma clave para analizar la opinión pública a gran escala; sin embargo, los enfoques centralizados tradicionales plantean preocupaciones significativas en cuanto a la privacidad y la gobernanza de datos. Para abordar estos desafíos, este documento presenta un estudio empírico de un enfoque de aprendizaje federado basado en un modelo BERT para el análisis de sentimientos descentralizado a nivel de tweet. Este estudio se centra en evaluar la efectividad de los modelos basados en transformadores bajo distribuciones de datos no independientes e idénticamente distribuidos (no-IID) en clientes distribuidos. El enfoque propuesto permite el entrenamiento colaborativo del modelo sin compartir datos de tweets en bruto, preservando así la privacidad del usuario mientras se aprovecha el conocimiento de múltiples fuentes. El modelo se evalúa a lo largo de 100 rondas de comunicación utilizando el conjunto de datos Sentiment140, distribuido entre cuatro clientes con distribuciones de datos heterogéneas. Los resultados experimentales demuestran una convergencia estable y un rendimiento robusto, con una precisión del 95.00%, un puntaje F1 del 95.00% y un PR-AUC del 96.76%. Cabe señalar que el modelo federado se desempeña dentro del 1.2% de una línea base centralizada, lo que indica una degradación mínima del rendimiento a pesar de las restricciones de intercambio de datos.
Descripción
Twitter/x se ha convertido en una plataforma clave para analizar la opinión pública a gran escala; sin embargo, los enfoques centralizados tradicionales plantean preocupaciones significativas en cuanto a la privacidad y la gobernanza de datos. Para abordar estos desafíos, este documento presenta un estudio empírico de un enfoque de aprendizaje federado basado en un modelo BERT para el análisis de sentimientos descentralizado a nivel de tweet. Este estudio se centra en evaluar la efectividad de los modelos basados en transformadores bajo distribuciones de datos no independientes e idénticamente distribuidos (no-IID) en clientes distribuidos. El enfoque propuesto permite el entrenamiento colaborativo del modelo sin compartir datos de tweets en bruto, preservando así la privacidad del usuario mientras se aprovecha el conocimiento de múltiples fuentes. El modelo se evalúa a lo largo de 100 rondas de comunicación utilizando el conjunto de datos Sentiment140, distribuido entre cuatro clientes con distribuciones de datos heterogéneas. Los resultados experimentales demuestran una convergencia estable y un rendimiento robusto, con una precisión del 95.00%, un puntaje F1 del 95.00% y un PR-AUC del 96.76%. Cabe señalar que el modelo federado se desempeña dentro del 1.2% de una línea base centralizada, lo que indica una degradación mínima del rendimiento a pesar de las restricciones de intercambio de datos.