Método de Generación de Palabras Clave Jerárquico para Texto de Redes Sociales de Bajo Recurso
Autores: Guan, Xinyi; Long, Shun
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Método de Generación de Palabras Clave Jerárquico para Texto de Redes Sociales de Bajo Recurso
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Crecimiento exponencial
Texto en redes sociales
Modelos de aprendizaje profundo
Palabras clave
Generación jerárquica de palabras clave
Entrenamiento auto-supervisado
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El crecimiento exponencial de la información textual en las redes sociales presenta un problema desafiante en términos de recuperar información valiosa de manera eficiente. Utilizando modelos de aprendizaje profundo, podemos generar automáticamente palabras clave que expresen el contenido y los temas centrales del texto en redes sociales, facilitando así la recuperación de información crítica. Sin embargo, el rendimiento de los modelos de aprendizaje profundo está limitado por los datos de texto etiquetados en el dominio de las redes sociales. Para abordar este problema, este artículo presenta un método de generación de palabras clave jerárquico para textos de redes sociales con pocos recursos. Específicamente, el segmento de texto se introduce como una unidad jerárquica del texto en redes sociales para construir una estructura de modelo jerárquica y diseñar una tarea de recuperación de segmentos de texto para el entrenamiento auto-supervisado del modelo, lo que no solo mejora la capacidad del modelo para extraer características del texto en redes sociales, sino que también reduce la dependencia del modelo de generación de palabras clave en los datos etiquetados en el dominio de las redes sociales. Los resultados experimentales de conjuntos de datos de redes sociales disponibles públicamente demuestran que el método propuesto puede mejorar efectivamente el rendimiento de generación de palabras clave incluso con datos etiquetados limitados en redes sociales. Además, las discusiones adicionales demuestran que la etapa de entrenamiento auto-supervisado basada en la tarea de recuperación de segmentos de texto beneficia al modelo en su adaptación al dominio del texto en redes sociales.
Descripción
El crecimiento exponencial de la información textual en las redes sociales presenta un problema desafiante en términos de recuperar información valiosa de manera eficiente. Utilizando modelos de aprendizaje profundo, podemos generar automáticamente palabras clave que expresen el contenido y los temas centrales del texto en redes sociales, facilitando así la recuperación de información crítica. Sin embargo, el rendimiento de los modelos de aprendizaje profundo está limitado por los datos de texto etiquetados en el dominio de las redes sociales. Para abordar este problema, este artículo presenta un método de generación de palabras clave jerárquico para textos de redes sociales con pocos recursos. Específicamente, el segmento de texto se introduce como una unidad jerárquica del texto en redes sociales para construir una estructura de modelo jerárquica y diseñar una tarea de recuperación de segmentos de texto para el entrenamiento auto-supervisado del modelo, lo que no solo mejora la capacidad del modelo para extraer características del texto en redes sociales, sino que también reduce la dependencia del modelo de generación de palabras clave en los datos etiquetados en el dominio de las redes sociales. Los resultados experimentales de conjuntos de datos de redes sociales disponibles públicamente demuestran que el método propuesto puede mejorar efectivamente el rendimiento de generación de palabras clave incluso con datos etiquetados limitados en redes sociales. Además, las discusiones adicionales demuestran que la etapa de entrenamiento auto-supervisado basada en la tarea de recuperación de segmentos de texto beneficia al modelo en su adaptación al dominio del texto en redes sociales.