Un nuevo método para la representación basada en gráficos del texto en el procesamiento del lenguaje natural
Autores: Probierz, Barbara; Hrabia, Anita; Kozak, Jan
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Un nuevo método para la representación basada en gráficos del texto en el procesamiento del lenguaje natural
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Procesamiento de lenguaje natural
Aprendizaje automático
Inteligencia artificial
Representación textual
Representaciones gráficas
Clasificación de texto
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
El procesamiento del lenguaje natural sigue siendo un campo emergente en el aprendizaje automático. El acceso a conjuntos de datos cada vez más grandes en forma de texto, nuevas aplicaciones para la inteligencia artificial y la necesidad de una comunicación simple con los sistemas operativos afectan simultáneamente la importancia del procesamiento del lenguaje natural en la evolución de la inteligencia artificial. Los métodos tradicionales de representación textual, como el Bag-of-Words, tienen algunas limitaciones que resultan de la falta de consideración de la semántica y las dependencias entre las palabras. Por lo tanto, proponemos un nuevo enfoque basado en representaciones de grafos, que tiene en cuenta tanto el contexto local como las relaciones globales entre palabras, lo que permite una representación textual más expresiva. El objetivo del documento es examinar la posibilidad de utilizar representaciones de grafos en el procesamiento del lenguaje natural y demostrar su uso en la clasificación de textos. Un elemento innovador del enfoque propuesto es el uso de cliques comunes en los grafos que representan documentos para crear un vector de características. Los experimentos confirman que el enfoque propuesto puede mejorar la eficiencia de la clasificación. El uso de un nuevo método de representación de texto para predecir categorías de libros basado en el análisis de su contenido dio como resultado una precisión, recuperación y puntaje F1 de más del 90%. Pasar de enfoques tradicionales a un enfoque basado en grafos podría marcar una gran diferencia en el procesamiento del lenguaje natural y el análisis de textos, y podría abrir nuevas oportunidades en el campo.
Descripción
El procesamiento del lenguaje natural sigue siendo un campo emergente en el aprendizaje automático. El acceso a conjuntos de datos cada vez más grandes en forma de texto, nuevas aplicaciones para la inteligencia artificial y la necesidad de una comunicación simple con los sistemas operativos afectan simultáneamente la importancia del procesamiento del lenguaje natural en la evolución de la inteligencia artificial. Los métodos tradicionales de representación textual, como el Bag-of-Words, tienen algunas limitaciones que resultan de la falta de consideración de la semántica y las dependencias entre las palabras. Por lo tanto, proponemos un nuevo enfoque basado en representaciones de grafos, que tiene en cuenta tanto el contexto local como las relaciones globales entre palabras, lo que permite una representación textual más expresiva. El objetivo del documento es examinar la posibilidad de utilizar representaciones de grafos en el procesamiento del lenguaje natural y demostrar su uso en la clasificación de textos. Un elemento innovador del enfoque propuesto es el uso de cliques comunes en los grafos que representan documentos para crear un vector de características. Los experimentos confirman que el enfoque propuesto puede mejorar la eficiencia de la clasificación. El uso de un nuevo método de representación de texto para predecir categorías de libros basado en el análisis de su contenido dio como resultado una precisión, recuperación y puntaje F1 de más del 90%. Pasar de enfoques tradicionales a un enfoque basado en grafos podría marcar una gran diferencia en el procesamiento del lenguaje natural y el análisis de textos, y podría abrir nuevas oportunidades en el campo.