Mejora de la clasificación de texto con redes convolucionales de grafos conscientes de las etiquetas
Autores: Lin, Ming-Yen; Liu, Hsuan-Chun; Hsush, Sue-Chen
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejora de la clasificación de texto con redes convolucionales de grafos conscientes de las etiquetas
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Clasificación de texto
Red neuronal gráfica
LaGCN
Modelos de aprendizaje profundo
Información de clase
Mejoras en la precisión
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 33
Citaciones: Sin citaciones
La clasificación de texto es un campo de investigación importante en la minería de texto y el procesamiento del lenguaje natural, que está ganando impulso con el crecimiento de las redes sociales. A pesar de los avances en precisión realizados por los modelos de aprendizaje profundo, los métodos existentes basados en redes neuronales gráficas a menudo pasan por alto la información implícita de clase dentro de los textos. Para abordar esta brecha, proponemos un modelo de red neuronal gráfica llamado LaGCN para mejorar la precisión de la clasificación. LaGCN utiliza la información de clase latente en los textos, tratándola como etiquetas de clase explícitas. Refina el proceso de convolución gráfica al agregar nodos conscientes de la etiqueta para capturar las correlaciones documento-palabra, palabra-palabra y palabra-clase para la clasificación de texto. Comparando LaGCN con modelos de vanguardia como HDGCN y BERT, nuestros experimentos en los conjuntos de datos Ohsumed, Movie Review, 20 Newsgroups y R8 demuestran su superioridad. LaGCN superó a los métodos existentes, mostrando mejoras promedio de precisión del 19.47%, 10%, 4.67% y 0.4%, respectivamente. Este avance subraya la importancia de integrar información de clase en las redes neuronales gráficas, estableciendo un nuevo punto de referencia para las tareas de clasificación de texto.
Descripción
La clasificación de texto es un campo de investigación importante en la minería de texto y el procesamiento del lenguaje natural, que está ganando impulso con el crecimiento de las redes sociales. A pesar de los avances en precisión realizados por los modelos de aprendizaje profundo, los métodos existentes basados en redes neuronales gráficas a menudo pasan por alto la información implícita de clase dentro de los textos. Para abordar esta brecha, proponemos un modelo de red neuronal gráfica llamado LaGCN para mejorar la precisión de la clasificación. LaGCN utiliza la información de clase latente en los textos, tratándola como etiquetas de clase explícitas. Refina el proceso de convolución gráfica al agregar nodos conscientes de la etiqueta para capturar las correlaciones documento-palabra, palabra-palabra y palabra-clase para la clasificación de texto. Comparando LaGCN con modelos de vanguardia como HDGCN y BERT, nuestros experimentos en los conjuntos de datos Ohsumed, Movie Review, 20 Newsgroups y R8 demuestran su superioridad. LaGCN superó a los métodos existentes, mostrando mejoras promedio de precisión del 19.47%, 10%, 4.67% y 0.4%, respectivamente. Este avance subraya la importancia de integrar información de clase en las redes neuronales gráficas, estableciendo un nuevo punto de referencia para las tareas de clasificación de texto.