Procesamiento Lingüístico a Gran Escala de Tweets para Entender las Interacciones Sociales entre Hablantes de Lenguas con Menos Recursos: El Caso Vasco
Autores: Fernandez de Landa, Joseba; Agerri, Rodrigo; Alegria, Iñaki
Idioma: Inglés
Editor: MDPI
Año: 2019
Acceso abierto
Artículo científico
2019
Procesamiento Lingüístico a Gran Escala de Tweets para Entender las Interacciones Sociales entre Hablantes de Lenguas con Menos Recursos: El Caso Vasco
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Redes sociales
Comunicación
Investigación lingüística
Procesamiento de lenguaje natural
Tuits
Etapas de la vida
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Las redes sociales como Twitter son cada vez más importantes en la creación de nuevas formas de comunicación. También se han convertido en herramientas útiles para la investigación social y lingüística debido a las enormes cantidades de datos textuales públicos disponibles. Esto es particularmente importante para los idiomas con menos recursos, ya que permite aplicar técnicas actuales de procesamiento de lenguaje natural a grandes cantidades de datos no estructurados. En este trabajo, estudiamos los aspectos lingüísticos y sociales del comportamiento de jóvenes y adultos en función del contenido de sus tweets y las relaciones sociales que surgen de ellos. Con este objetivo en mente, hemos recopilado más de 10 millones de tweets de más de 8000 usuarios. Primero, clasificamos a cada usuario en función de su etapa de vida (joven/adulto) de acuerdo con el estilo de escritura de sus tweets. En segundo lugar, aplicamos técnicas de modelado de temas a los tweets personales para encontrar los temas más populares según las etapas de vida. En tercer lugar, establecimos las relaciones y comunidades que emergen en función de los retweets. Concluimos que el uso de grandes cantidades de datos no estructurados proporcionados por Twitter facilita la investigación social utilizando técnicas computacionales como el procesamiento de lenguaje natural, brindando la oportunidad tanto de segmentar comunidades en función de características demográficas como de descubrir cómo interactúan o se relacionan entre sí.
Descripción
Las redes sociales como Twitter son cada vez más importantes en la creación de nuevas formas de comunicación. También se han convertido en herramientas útiles para la investigación social y lingüística debido a las enormes cantidades de datos textuales públicos disponibles. Esto es particularmente importante para los idiomas con menos recursos, ya que permite aplicar técnicas actuales de procesamiento de lenguaje natural a grandes cantidades de datos no estructurados. En este trabajo, estudiamos los aspectos lingüísticos y sociales del comportamiento de jóvenes y adultos en función del contenido de sus tweets y las relaciones sociales que surgen de ellos. Con este objetivo en mente, hemos recopilado más de 10 millones de tweets de más de 8000 usuarios. Primero, clasificamos a cada usuario en función de su etapa de vida (joven/adulto) de acuerdo con el estilo de escritura de sus tweets. En segundo lugar, aplicamos técnicas de modelado de temas a los tweets personales para encontrar los temas más populares según las etapas de vida. En tercer lugar, establecimos las relaciones y comunidades que emergen en función de los retweets. Concluimos que el uso de grandes cantidades de datos no estructurados proporcionados por Twitter facilita la investigación social utilizando técnicas computacionales como el procesamiento de lenguaje natural, brindando la oportunidad tanto de segmentar comunidades en función de características demográficas como de descubrir cómo interactúan o se relacionan entre sí.