Ttg-text: un marco de representación de texto basado en gráficos mejorado por testores típicos para una clasificación mejorada
Autores: Sánchez-Antonio, Carlos; Valdez-Rodríguez, José E.; Calvo, Hiram
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ttg-text: un marco de representación de texto basado en gráficos mejorado por testores típicos para una clasificación mejorada
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Avances
Representación de texto basada en gráficos
TTG-Text
Técnica de selección de características
Interpretabilidad
Red convolucional de grafos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Los avances recientes en la representación de texto basada en grafos, especialmente con modelos de incrustación y transformadores como BERT, han mostrado un potencial significativo para mejorar las tareas de procesamiento de lenguaje natural (NLP). Sin embargo, persisten desafíos relacionados con la escasez de datos y la limitada interpretabilidad, especialmente al trabajar con conjuntos de datos pequeños o desequilibrados. Este artículo presenta TTG-Text, un marco novedoso que fortalece la representación de texto basada en grafos al integrar testores típicos, una técnica de selección de características simbólica que refina la importancia de las características al tiempo que reduce la dimensionalidad. A diferencia del peso tradicional TF-IDF, TTG-Text aprovecha los testores típicos para mejorar la relevancia de las características dentro de los grafos de texto, lo que resulta en una interpretabilidad y rendimiento del modelo mejorados, especialmente para conjuntos de datos más pequeños. Nuestra evaluación en una tarea de clasificación de texto utilizando una red convolucional de grafos (GCN) demuestra que TTG-Text logra una tasa de precisión del 95%, superando a los métodos convencionales y a BERT con menos épocas de entrenamiento requeridas. Al combinar algoritmos simbólicos con modelos basados en grafos, este enfoque híbrido ofrece una solución más interpretable, eficiente y de alto rendimiento para tareas complejas de NLP.
Descripción
Los avances recientes en la representación de texto basada en grafos, especialmente con modelos de incrustación y transformadores como BERT, han mostrado un potencial significativo para mejorar las tareas de procesamiento de lenguaje natural (NLP). Sin embargo, persisten desafíos relacionados con la escasez de datos y la limitada interpretabilidad, especialmente al trabajar con conjuntos de datos pequeños o desequilibrados. Este artículo presenta TTG-Text, un marco novedoso que fortalece la representación de texto basada en grafos al integrar testores típicos, una técnica de selección de características simbólica que refina la importancia de las características al tiempo que reduce la dimensionalidad. A diferencia del peso tradicional TF-IDF, TTG-Text aprovecha los testores típicos para mejorar la relevancia de las características dentro de los grafos de texto, lo que resulta en una interpretabilidad y rendimiento del modelo mejorados, especialmente para conjuntos de datos más pequeños. Nuestra evaluación en una tarea de clasificación de texto utilizando una red convolucional de grafos (GCN) demuestra que TTG-Text logra una tasa de precisión del 95%, superando a los métodos convencionales y a BERT con menos épocas de entrenamiento requeridas. Al combinar algoritmos simbólicos con modelos basados en grafos, este enfoque híbrido ofrece una solución más interpretable, eficiente y de alto rendimiento para tareas complejas de NLP.