Identificación automática de palabras vacías multilingües a partir de corpus muy pequeños
Autores: Ferilli, Stefano
Idioma: Inglés
Editor: MDPI
Año: 2021
Acceso abierto
Artículo científico
2021
Identificación automática de palabras vacías multilingües a partir de corpus muy pequeños
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Procesamiento de lenguaje natural
Recursos lingüísticos
Corpus de entrenamiento
Palabras vacías
Frecuencia de documentos
Corte automático
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 34
Citaciones: Sin citaciones
Las herramientas para el trabajo de Procesamiento del Lenguaje Natural utilizan recursos lingüísticos que son específicos de cada idioma. La complejidad de construir dichos recursos hace que muchas lenguas carezcan de ellos. Por lo tanto, aprenderlos automáticamente a partir de textos de muestra sería una solución deseable. Esto suele requerir enormes corpora de entrenamiento, que no están disponibles para muchos idiomas locales y jergas, que carecen de una amplia literatura.
Descripción
Las herramientas para el trabajo de Procesamiento del Lenguaje Natural utilizan recursos lingüísticos que son específicos de cada idioma. La complejidad de construir dichos recursos hace que muchas lenguas carezcan de ellos. Por lo tanto, aprenderlos automáticamente a partir de textos de muestra sería una solución deseable. Esto suele requerir enormes corpora de entrenamiento, que no están disponibles para muchos idiomas locales y jergas, que carecen de una amplia literatura.