En mejora de la clasificación de texto y análisis de emociones de texto utilizando aprendizaje de máquina de gráficos y métodos de aprendizaje de conjunto en conjuntos de datos no ingleses
Autores: Gholami, Fatemeh; Rahmati, Zahed; Mofidi, Alireza; Abbaszadeh, Mostafa
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
En mejora de la clasificación de texto y análisis de emociones de texto utilizando aprendizaje de máquina de gráficos y métodos de aprendizaje de conjunto en conjuntos de datos no ingleses
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Software
Palabras clave
Enfoques de aprendizaje automático
Métodos de aprendizaje de gráficos
Procesamiento del lenguaje natural
Tareas de clasificación de texto
Red neuronal de grafos
Arquitecturas de GNN
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 27
Citaciones: Sin citaciones
En los últimos años, los enfoques de aprendizaje automático, en particular los métodos de aprendizaje de grafos, han logrado grandes resultados en el campo del procesamiento del lenguaje natural, en particular en tareas de clasificación de texto. Sin embargo, muchos de estos modelos han mostrado una generalización limitada en conjuntos de datos en diferentes idiomas. En esta investigación, investigamos y elaboramos métodos de aprendizaje de grafos en conjuntos de datos no ingleses (como el conjunto de datos persa Digikala), que consisten en opiniones de usuarios para la tarea de clasificación de texto. Más específicamente, investigamos diferentes combinaciones de (Pars) BERT con varias arquitecturas de redes neuronales de grafos (GNN) (como GCN, GAT y GIN) y también utilizamos métodos de aprendizaje de conjunto para abordar la tarea de clasificación de texto en ciertos conjuntos de datos no ingleses conocidos. Nuestro análisis y resultados demuestran cómo la aplicación de modelos GNN ayuda a lograr buenas puntuaciones en la tarea de clasificación de texto al capturar mejor la información topológica entre los datos textuales. Además, nuestros experimentos muestran cómo los modelos que utilizan modelos pre-entrenados específicos de un idioma (como ParsBERT, en lugar de BERT) capturan mejor la información sobre los datos, lo que resulta en una mayor precisión.
Descripción
En los últimos años, los enfoques de aprendizaje automático, en particular los métodos de aprendizaje de grafos, han logrado grandes resultados en el campo del procesamiento del lenguaje natural, en particular en tareas de clasificación de texto. Sin embargo, muchos de estos modelos han mostrado una generalización limitada en conjuntos de datos en diferentes idiomas. En esta investigación, investigamos y elaboramos métodos de aprendizaje de grafos en conjuntos de datos no ingleses (como el conjunto de datos persa Digikala), que consisten en opiniones de usuarios para la tarea de clasificación de texto. Más específicamente, investigamos diferentes combinaciones de (Pars) BERT con varias arquitecturas de redes neuronales de grafos (GNN) (como GCN, GAT y GIN) y también utilizamos métodos de aprendizaje de conjunto para abordar la tarea de clasificación de texto en ciertos conjuntos de datos no ingleses conocidos. Nuestro análisis y resultados demuestran cómo la aplicación de modelos GNN ayuda a lograr buenas puntuaciones en la tarea de clasificación de texto al capturar mejor la información topológica entre los datos textuales. Además, nuestros experimentos muestran cómo los modelos que utilizan modelos pre-entrenados específicos de un idioma (como ParsBERT, en lugar de BERT) capturan mejor la información sobre los datos, lo que resulta en una mayor precisión.