Desambiguación de Sentido de Palabras para Lenguas Ricas en Morfología y de Bajos Recursos: Una Revisión Sistemática de la Literatura y un Meta-Análisis
Autores: Masethe, Hlaudi Daniel; Masethe, Mosima Anna; Ojo, Sunday Olusegun; Giunchiglia, Fausto; Owolawi, Pius Adewale
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Desambiguación de Sentido de Palabras para Lenguas Ricas en Morfología y de Bajos Recursos: Una Revisión Sistemática de la Literatura y un Meta-Análisis
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Procesamiento de lenguaje natural
Desambiguación de sentidos de palabras
Lenguas de bajos recursos
Entrenamiento de modelos
Meta-análisis
Medidas de rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el procesamiento del lenguaje natural, la desambiguación de sentidos de palabras (WSD) sigue siendo una dificultad importante, especialmente para los idiomas de bajos recursos donde la variación lingüística y la falta de datos dificultan el entrenamiento y la evaluación de modelos. El objetivo de esta revisión exhaustiva y meta-análisis de la literatura es resumir el cuerpo de conocimiento sobre las técnicas de WSD para idiomas de bajos recursos, enfatizando las ventajas y desventajas de diferentes estrategias. Una búsqueda exhaustiva en varias bases de datos para literatura relevante produjo artículos que evalúan métodos de WSD en idiomas de bajos recursos. Se extrajeron tamaños de efecto y medidas de rendimiento de un subconjunto de ensayos a través del análisis. La heterogeneidad se evaluó utilizando el efecto combinado y se calcularon estimaciones mediante meta-análisis. Se utilizaron los elementos de informe preferidos para revisiones sistemáticas y meta-análisis (PRISMA) para desarrollar el proceso de selección de los artículos relevantes para la extracción. El meta-análisis incluyó 32 estudios, abarcando una variedad de métodos de WSD y lenguas de bajos recursos. El tamaño de efecto combinado general indicó una efectividad moderada de las técnicas de WSD. La heterogeneidad entre los estudios fue alta, con un valor I2 de 82.29%, lo que sugiere una variabilidad sustancial en el rendimiento de WSD a través de diferentes estudios. El valor tau de 5.819 refleja aún más la extensión de la varianza entre estudios. Esta variabilidad subraya los desafíos en la generalización de hallazgos y destaca la influencia de diversos factores como las características específicas del idioma, la calidad del conjunto de datos y las diferencias metodológicas. Los valores p del meta-regresión (0.454) y del meta-análisis (0.440) sugieren que la variabilidad en el rendimiento de WSD no está estadísticamente asociada de manera significativa con los moderadores investigados, lo que indica que las diferencias en el rendimiento pueden estar influenciadas por factores que no se capturan completamente en el análisis actual. La ausencia de valores p significativos plantea la posibilidad de que los problemas presentados por situaciones de bajos recursos aún no estén bien abordados por los modelos y técnicas en uso.
Descripción
En el procesamiento del lenguaje natural, la desambiguación de sentidos de palabras (WSD) sigue siendo una dificultad importante, especialmente para los idiomas de bajos recursos donde la variación lingüística y la falta de datos dificultan el entrenamiento y la evaluación de modelos. El objetivo de esta revisión exhaustiva y meta-análisis de la literatura es resumir el cuerpo de conocimiento sobre las técnicas de WSD para idiomas de bajos recursos, enfatizando las ventajas y desventajas de diferentes estrategias. Una búsqueda exhaustiva en varias bases de datos para literatura relevante produjo artículos que evalúan métodos de WSD en idiomas de bajos recursos. Se extrajeron tamaños de efecto y medidas de rendimiento de un subconjunto de ensayos a través del análisis. La heterogeneidad se evaluó utilizando el efecto combinado y se calcularon estimaciones mediante meta-análisis. Se utilizaron los elementos de informe preferidos para revisiones sistemáticas y meta-análisis (PRISMA) para desarrollar el proceso de selección de los artículos relevantes para la extracción. El meta-análisis incluyó 32 estudios, abarcando una variedad de métodos de WSD y lenguas de bajos recursos. El tamaño de efecto combinado general indicó una efectividad moderada de las técnicas de WSD. La heterogeneidad entre los estudios fue alta, con un valor I2 de 82.29%, lo que sugiere una variabilidad sustancial en el rendimiento de WSD a través de diferentes estudios. El valor tau de 5.819 refleja aún más la extensión de la varianza entre estudios. Esta variabilidad subraya los desafíos en la generalización de hallazgos y destaca la influencia de diversos factores como las características específicas del idioma, la calidad del conjunto de datos y las diferencias metodológicas. Los valores p del meta-regresión (0.454) y del meta-análisis (0.440) sugieren que la variabilidad en el rendimiento de WSD no está estadísticamente asociada de manera significativa con los moderadores investigados, lo que indica que las diferencias en el rendimiento pueden estar influenciadas por factores que no se capturan completamente en el análisis actual. La ausencia de valores p significativos plantea la posibilidad de que los problemas presentados por situaciones de bajos recursos aún no estén bien abordados por los modelos y técnicas en uso.