logo móvil
Contáctanos

Un nuevo método para la representación basada en gráficos del texto en el procesamiento del lenguaje natural

Autores: Probierz, Barbara; Hrabia, Anita; Kozak, Jan

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Un nuevo método para la representación basada en gráficos del texto en el procesamiento del lenguaje natural


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Procesamiento de lenguaje natural
Aprendizaje automático
Inteligencia artificial
Representación textual
Representaciones gráficas
Clasificación de texto

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
El procesamiento del lenguaje natural sigue siendo un campo emergente en el aprendizaje automático. El acceso a conjuntos de datos cada vez más grandes en forma de texto, nuevas aplicaciones para la inteligencia artificial y la necesidad de una comunicación simple con los sistemas operativos afectan simultáneamente la importancia del procesamiento del lenguaje natural en la evolución de la inteligencia artificial. Los métodos tradicionales de representación textual, como el Bag-of-Words, tienen algunas limitaciones que resultan de la falta de consideración de la semántica y las dependencias entre las palabras. Por lo tanto, proponemos un nuevo enfoque basado en representaciones de grafos, que tiene en cuenta tanto el contexto local como las relaciones globales entre palabras, lo que permite una representación textual más expresiva. El objetivo del documento es examinar la posibilidad de utilizar representaciones de grafos en el procesamiento del lenguaje natural y demostrar su uso en la clasificación de textos. Un elemento innovador del enfoque propuesto es el uso de cliques comunes en los grafos que representan documentos para crear un vector de características. Los experimentos confirman que el enfoque propuesto puede mejorar la eficiencia de la clasificación. El uso de un nuevo método de representación de texto para predecir categorías de libros basado en el análisis de su contenido dio como resultado una precisión, recuperación y puntaje F1 de más del 90%. Pasar de enfoques tradicionales a un enfoque basado en grafos podría marcar una gran diferencia en el procesamiento del lenguaje natural y el análisis de textos, y podría abrir nuevas oportunidades en el campo.

Otros recursos que podrían interesarte

Temas Virtualpro