Viabilidad de las Redes Neuronales para Tecnologías Básicas para Lenguas con Escasez de Recursos
Autores: Loubser, Melinda; Puttkammer, Martin J.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Viabilidad de las Redes Neuronales para Tecnologías Básicas para Lenguas con Escasez de Recursos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Red neuronal
Lenguas sudafricanas
Tecnologías fundamentales
Procesamiento de lenguaje natural
Etiquetado de partes del discurso
Reconocimiento de entidades nombradas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este artículo, se evalúa la viabilidad de las implementaciones de redes neuronales de tecnologías fundamentales (el enfoque de este artículo son las tecnologías de texto) para 10 lenguas sudafricanas con escasos recursos. Las redes neuronales se están utilizando cada vez más en lugar de otros métodos de aprendizaje automático para muchas tareas de procesamiento del lenguaje natural con buenos resultados. Sin embargo, en el contexto sudafricano, donde la mayoría de las lenguas son escasas en recursos, se ha investigado muy poco sobre las implementaciones de redes neuronales de tecnologías lingüísticas fundamentales. En este artículo, abordamos esta brecha evaluando las implementaciones de redes neuronales de cuatro tecnologías fundamentales para diez lenguas sudafricanas. Las tecnologías que abordamos son el etiquetado de partes del discurso, el reconocimiento de entidades nombradas, el análisis de compuestos y la lematización. Se implementaron arquitecturas neuronales que funcionaron bien en tareas similares en otros entornos para cada tarea y se evaluó el rendimiento en comparación con las implementaciones actuales de aprendizaje automático de cada tecnología. Los modelos de redes neuronales evaluados tienen un mejor rendimiento que las líneas base para el análisis de compuestos, son viables y comparables a la línea base en la mayoría de las lenguas para el etiquetado de partes del discurso y el reconocimiento de entidades nombradas, y son viables, pero no están a la par con la línea base, para la lematización en afrikáans.
Descripción
En este artículo, se evalúa la viabilidad de las implementaciones de redes neuronales de tecnologías fundamentales (el enfoque de este artículo son las tecnologías de texto) para 10 lenguas sudafricanas con escasos recursos. Las redes neuronales se están utilizando cada vez más en lugar de otros métodos de aprendizaje automático para muchas tareas de procesamiento del lenguaje natural con buenos resultados. Sin embargo, en el contexto sudafricano, donde la mayoría de las lenguas son escasas en recursos, se ha investigado muy poco sobre las implementaciones de redes neuronales de tecnologías lingüísticas fundamentales. En este artículo, abordamos esta brecha evaluando las implementaciones de redes neuronales de cuatro tecnologías fundamentales para diez lenguas sudafricanas. Las tecnologías que abordamos son el etiquetado de partes del discurso, el reconocimiento de entidades nombradas, el análisis de compuestos y la lematización. Se implementaron arquitecturas neuronales que funcionaron bien en tareas similares en otros entornos para cada tarea y se evaluó el rendimiento en comparación con las implementaciones actuales de aprendizaje automático de cada tecnología. Los modelos de redes neuronales evaluados tienen un mejor rendimiento que las líneas base para el análisis de compuestos, son viables y comparables a la línea base en la mayoría de las lenguas para el etiquetado de partes del discurso y el reconocimiento de entidades nombradas, y son viables, pero no están a la par con la línea base, para la lematización en afrikáans.