Desentrañando Patrones Léxicos y Narrativos en el Hikayat Lonthoir: Un Enfoque de Lingüística Computacional
Autores: Kersapati, Muhamad Iko; Perono Cacciafoco, Francesco; Sihite, Bimasyah; Wu, Shiyue; Widyaningrum, Khofiyana Putri; Atqa, Mohamad; Toni, Elvis A. B.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Desentrañando Patrones Léxicos y Narrativos en el Hikayat Lonthoir: Un Enfoque de Lingüística Computacional
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Raro
Saga
Manuscrito
Métodos computacionales
Histórico
Lingüístico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Hikayat Lonthoir, una rara colección de manuscritos de saga originaria del archipiélago de Banda, Maluku, Indonesia, conserva una significativa historia oral indígena en medio de la narrativa colonial occidental. Este estudio busca aprovechar métodos computacionales para analizar el manuscrito histórico que constituye una combinación de transcripción supervisada por OCR, perfilado lingüístico de corpus, agrupamiento semántico (Word2Vec + K-Means) y análisis de redes de entidades nombradas. Se realiza una validación del conjunto de datos en 2793 tokens de palabras limpiadas hacia diccionarios indonesios y malayos, mostrando que el 50.3% se superpuso con ambos diccionarios, con un fuerte acuerdo entre diccionarios ( = 0.76). El análisis léxico indica que la monarquía/gobernanza, el parentesco, el vocabulario marítimo y una extensa productividad morfológica (me-, di-, ter-, pe-/per-, -nya, -an), mientras que los análisis semántico y de red identifican dos núcleos narrativos, desarrollados en los sistemas de clasificación Aarne-Thompson-Uther (ATU) y el Índice de Motivos de Literatura Popular de Stith Thompson. Estos hallazgos demuestran cómo los métodos computacionales pueden extraer patrones estructurales, temáticos y relacionales de manuscritos históricos y contribuir con conocimientos basados en evidencia a la filología digital y la lingüística histórica.
Descripción
Hikayat Lonthoir, una rara colección de manuscritos de saga originaria del archipiélago de Banda, Maluku, Indonesia, conserva una significativa historia oral indígena en medio de la narrativa colonial occidental. Este estudio busca aprovechar métodos computacionales para analizar el manuscrito histórico que constituye una combinación de transcripción supervisada por OCR, perfilado lingüístico de corpus, agrupamiento semántico (Word2Vec + K-Means) y análisis de redes de entidades nombradas. Se realiza una validación del conjunto de datos en 2793 tokens de palabras limpiadas hacia diccionarios indonesios y malayos, mostrando que el 50.3% se superpuso con ambos diccionarios, con un fuerte acuerdo entre diccionarios ( = 0.76). El análisis léxico indica que la monarquía/gobernanza, el parentesco, el vocabulario marítimo y una extensa productividad morfológica (me-, di-, ter-, pe-/per-, -nya, -an), mientras que los análisis semántico y de red identifican dos núcleos narrativos, desarrollados en los sistemas de clasificación Aarne-Thompson-Uther (ATU) y el Índice de Motivos de Literatura Popular de Stith Thompson. Estos hallazgos demuestran cómo los métodos computacionales pueden extraer patrones estructurales, temáticos y relacionales de manuscritos históricos y contribuir con conocimientos basados en evidencia a la filología digital y la lingüística histórica.