Extracción de Temas: La Perspectiva de BERTopic sobre el Twitterverso del 117º Congreso
Autores: Mendonça, Margarida; Figueira, Álvaro
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Extracción de Temas: La Perspectiva de BERTopic sobre el Twitterverso del 117º Congreso
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Redes sociales
Impacto
Desinformación
Cámaras de eco
BERTopic
Modelado de temas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
A medida que las redes sociales (RS) se vuelven cada vez más prevalentes, se espera que su impacto en la sociedad crezca en consecuencia. Si bien las RS han traído transformaciones positivas, también han amplificado problemas preexistentes como la desinformación, las cámaras de eco, la manipulación y la propaganda. Una comprensión exhaustiva de este impacto, apoyada por herramientas analíticas de vanguardia y por una conciencia de los sesgos y complejidades sociales, nos permite anticipar y mitigar los posibles efectos negativos. Una de estas herramientas es BERTopic, un novedoso algoritmo de aprendizaje profundo desarrollado para la minería de temas, que ha demostrado ofrecer ventajas significativas sobre métodos tradicionales como la Asignación de Dirichlet Latente (LDA), particularmente en términos de su alta modularidad, que permite una personalización extensa en cada etapa del proceso de modelado de temas. En este estudio, hipotetizamos que BERTopic, cuando se optimiza para datos de Twitter, puede proporcionar un modelado de temas más coherente y estable. Comenzamos realizando una revisión de la literatura sobre enfoques de minería de temas para datos de texto corto. Usando este conocimiento, exploramos el potencial para optimizar BERTopic y analizamos su efectividad. Nuestro enfoque se centró en datos de Twitter que abarcan los dos años del 117º Congreso de EE. UU. Evaluamos el rendimiento de BERTopic utilizando puntuaciones de coherencia, perplejidad, diversidad y estabilidad, encontrando mejoras significativas sobre métodos tradicionales y los parámetros predeterminados para esta herramienta. Descubrimos que son posibles mejoras en la coherencia y estabilidad de BERTopic. También identificamos los principales temas de este Congreso, que incluyen el aborto, la deuda estudiantil y la jueza Ketanji Brown Jackson. Además, describimos una aplicación simple que desarrollamos para una mejor visualización de los temas del Congreso.
Descripción
A medida que las redes sociales (RS) se vuelven cada vez más prevalentes, se espera que su impacto en la sociedad crezca en consecuencia. Si bien las RS han traído transformaciones positivas, también han amplificado problemas preexistentes como la desinformación, las cámaras de eco, la manipulación y la propaganda. Una comprensión exhaustiva de este impacto, apoyada por herramientas analíticas de vanguardia y por una conciencia de los sesgos y complejidades sociales, nos permite anticipar y mitigar los posibles efectos negativos. Una de estas herramientas es BERTopic, un novedoso algoritmo de aprendizaje profundo desarrollado para la minería de temas, que ha demostrado ofrecer ventajas significativas sobre métodos tradicionales como la Asignación de Dirichlet Latente (LDA), particularmente en términos de su alta modularidad, que permite una personalización extensa en cada etapa del proceso de modelado de temas. En este estudio, hipotetizamos que BERTopic, cuando se optimiza para datos de Twitter, puede proporcionar un modelado de temas más coherente y estable. Comenzamos realizando una revisión de la literatura sobre enfoques de minería de temas para datos de texto corto. Usando este conocimiento, exploramos el potencial para optimizar BERTopic y analizamos su efectividad. Nuestro enfoque se centró en datos de Twitter que abarcan los dos años del 117º Congreso de EE. UU. Evaluamos el rendimiento de BERTopic utilizando puntuaciones de coherencia, perplejidad, diversidad y estabilidad, encontrando mejoras significativas sobre métodos tradicionales y los parámetros predeterminados para esta herramienta. Descubrimos que son posibles mejoras en la coherencia y estabilidad de BERTopic. También identificamos los principales temas de este Congreso, que incluyen el aborto, la deuda estudiantil y la jueza Ketanji Brown Jackson. Además, describimos una aplicación simple que desarrollamos para una mejor visualización de los temas del Congreso.