Palabras de Red Social Homofónicas Num-Simbólicas
Autores: Chung, Yi-Liang; Hsu, Ping-Yu; Huang, Shih-Hsiang
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Palabras de Red Social Homofónicas Num-Simbólicas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Estudios
Redes sociales
Análisis de texto
Caracteres chinos
Números
Símbolos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Se pueden encontrar muchos estudios excelentes sobre redes sociales y análisis de texto en la literatura, lo que facilita el rápido desarrollo de la tecnología de análisis de texto automatizado. Debido a la falta de separadores naturales en chino, los números y símbolos del texto también tienen su significado literal original. Por lo tanto, combinar caracteres chinos con números y símbolos en contenido generado por usuarios es un desafío para los enfoques y procedimientos analíticos actuales. Por ello, proponemos un nuevo método híbrido para detectar neologismos homófonos numéricos y simbólicos mezclados en chino (BNShCNs). La interpretación de la semántica real de las palabras se realizó de acuerdo con su independencia y posición relativa en el contexto. Este estudio obtuvo una lista corta utilizando un enfoque probabilístico a partir de contenido generado por usuarios recopilado en internet; posteriormente, evaluamos la lista corta contextualizando vectores incrustados de palabras para la detección de BNShCN. Los experimentos muestran que el método propuesto extrajo de manera eficiente los BNShCNs del contenido generado por usuarios.
Descripción
Se pueden encontrar muchos estudios excelentes sobre redes sociales y análisis de texto en la literatura, lo que facilita el rápido desarrollo de la tecnología de análisis de texto automatizado. Debido a la falta de separadores naturales en chino, los números y símbolos del texto también tienen su significado literal original. Por lo tanto, combinar caracteres chinos con números y símbolos en contenido generado por usuarios es un desafío para los enfoques y procedimientos analíticos actuales. Por ello, proponemos un nuevo método híbrido para detectar neologismos homófonos numéricos y simbólicos mezclados en chino (BNShCNs). La interpretación de la semántica real de las palabras se realizó de acuerdo con su independencia y posición relativa en el contexto. Este estudio obtuvo una lista corta utilizando un enfoque probabilístico a partir de contenido generado por usuarios recopilado en internet; posteriormente, evaluamos la lista corta contextualizando vectores incrustados de palabras para la detección de BNShCN. Los experimentos muestran que el método propuesto extrajo de manera eficiente los BNShCNs del contenido generado por usuarios.