Explorando Textos Narrativos Folklóricos de África Occidental Usando Aprendizaje Automático
Autores: Lô, Gossa; de Boer, Victor; van Aart, Chris J.
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Explorando Textos Narrativos Folklóricos de África Occidental Usando Aprendizaje Automático
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje automático
Procesamiento del lenguaje natural
Cuentos populares de África Occidental
Análisis intercultural
Aprendizaje profundo
Estructuras narrativas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Este artículo examina cómo el aprendizaje automático (ML) y el procesamiento del lenguaje natural (NLP) pueden utilizarse para identificar, analizar y generar cuentos populares de África Occidental. Se compilan dos corpus de cuentos populares de África Occidental y de Europa Occidental y se utilizan en tres experimentos sobre el análisis de cuentos populares interculturales. En el experimento de generación de texto, se construyen y entrenan dos tipos de generadores de texto de aprendizaje profundo en el corpus de África Occidental. Mostramos que, aunque los textos varían entre coherencia semántica y sintáctica, cada uno de ellos contiene características de África Occidental. El segundo experimento examina más a fondo la distinción entre los cuentos populares de África Occidental y de Europa Occidental al comparar el rendimiento de un LSTM (acc. 0.79) con un clasificador BoW (acc. 0.93), lo que indica que los dos corpus pueden distinguirse claramente en términos de vocabulario. Una visualización interactiva t-SNE de un clasificador híbrido (acc. 0.85) destaca las palabras específicas de cada cultura. El tercer experimento describe un análisis de ML de las estructuras narrativas. Los clasificadores entrenados en partes de cuentos populares según la estructura de tres actos son bastante capaces de distinguir estas partes (acc. 0.78). Los n-gramas comunes extraídos de estas partes no solo subrayan las distinciones interculturales en las estructuras narrativas, sino que también muestran la superposición entre las narrativas orales y escritas de África Occidental.
Descripción
Este artículo examina cómo el aprendizaje automático (ML) y el procesamiento del lenguaje natural (NLP) pueden utilizarse para identificar, analizar y generar cuentos populares de África Occidental. Se compilan dos corpus de cuentos populares de África Occidental y de Europa Occidental y se utilizan en tres experimentos sobre el análisis de cuentos populares interculturales. En el experimento de generación de texto, se construyen y entrenan dos tipos de generadores de texto de aprendizaje profundo en el corpus de África Occidental. Mostramos que, aunque los textos varían entre coherencia semántica y sintáctica, cada uno de ellos contiene características de África Occidental. El segundo experimento examina más a fondo la distinción entre los cuentos populares de África Occidental y de Europa Occidental al comparar el rendimiento de un LSTM (acc. 0.79) con un clasificador BoW (acc. 0.93), lo que indica que los dos corpus pueden distinguirse claramente en términos de vocabulario. Una visualización interactiva t-SNE de un clasificador híbrido (acc. 0.85) destaca las palabras específicas de cada cultura. El tercer experimento describe un análisis de ML de las estructuras narrativas. Los clasificadores entrenados en partes de cuentos populares según la estructura de tres actos son bastante capaces de distinguir estas partes (acc. 0.78). Los n-gramas comunes extraídos de estas partes no solo subrayan las distinciones interculturales en las estructuras narrativas, sino que también muestran la superposición entre las narrativas orales y escritas de África Occidental.