logo móvil
Contáctanos

Un enfoque de evaluación de corpus basado en AHP extendido para manejar la clasificación de palabras clave de PLN: un ejemplo de datos de corpus de COVID-19

Autores: Chen, Liang-Ching; Chang, Kuei-Hu

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Un enfoque de evaluación de corpus basado en AHP extendido para manejar la clasificación de palabras clave de PLN: un ejemplo de datos de corpus de COVID-19


Categoría

Matemáticas

Subcategoría

Análisis matemático

Palabras clave

Enfoques de evaluación de corpus
Palabras clave
COVID-19
Procesamiento del Lenguaje Natural
Algoritmos
Proceso de jerarquía analítica

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 26

Citaciones: Sin citaciones


Descripción
El uso de enfoques de evaluación de corpus para determinar y clasificar palabras clave para datos de corpus es crítico debido a los problemas de recuperación de información (IR) en el Procesamiento del Lenguaje Natural (NLP), como cuando se encuentra con COVID-19, ya que puede determinar si las personas pueden obtener rápidamente conocimiento sobre la enfermedad. Los algoritmos utilizados para la evaluación de corpus deben considerar múltiples parámetros e integrar simultáneamente la información de evaluación subjetiva de los individuos para satisfacer las necesidades del mundo real. Sin embargo, los enfoques tradicionales de generación de listas de palabras clave se basan en un solo parámetro (es decir, el valor de relevancia) para determinar y clasificar palabras clave, lo cual es insuficiente. Para mejorar el beneficio de evaluación del enfoque tradicional de generación de listas de palabras clave, este documento propuso un enfoque de evaluación de corpus basado en el proceso analítico jerárquico extendido (AHP) para, en primer lugar, refinar los datos del corpus y luego utilizar el método AHP para calcular los pesos relativos de tres parámetros (relevancia, frecuencia y rango). Para verificar el enfoque propuesto, este documento adoptó 53 artículos de investigación sobre ciencias ambientales relacionados con COVID-19 de la Web of Science (WOS) como ejemplo empírico. Después de comparar con el enfoque tradicional de generación de listas de palabras clave y el método de pesos iguales (EW), las contribuciones significativas son: (1) utilizar la técnica basada en máquinas para eliminar palabras funcionales y sin sentido para optimizar los datos del corpus; (2) poder considerar múltiples parámetros simultáneamente; y (3) poder integrar los resultados de evaluación de los expertos para determinar los pesos relativos de los parámetros.

Otros recursos que podrían interesarte

Temas Virtualpro