Surfing the modeling of taggers in low-resource scenarios
Autores: Vilares Ferro, Manuel; Darriba Bilbao, Víctor M.; Ribadas Pena, Francisco J.; Graña Gil, Jorge
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Surfing the modeling of taggers in low-resource scenarios
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Técnicas estructuradas profundas
Procesamiento de lenguaje natural
Algoritmos de aprendizaje automático
Selección de modelos
Entornos de recursos limitados
Curvas de aprendizaje
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
La reciente tendencia hacia la aplicación de técnicas estructuradas profundas ha revelado los límites de los modelos enormes en el procesamiento del lenguaje natural. Esto ha reavivado el interés en los algoritmos tradicionales de aprendizaje automático, que han demostrado seguir siendo competitivos en ciertos contextos, especialmente en entornos con recursos limitados. En paralelo, la selección de modelos se ha convertido en una tarea esencial para mejorar el rendimiento a un costo razonable, aún más cuando hablamos de procesos que involucran dominios donde los recursos de entrenamiento y/o computacionales son escasos. Ante este panorama, evaluamos la estimación temprana de las curvas de aprendizaje como un mecanismo práctico para seleccionar el modelo más apropiado en escenarios caracterizados por el uso de aprendices no profundos en entornos con pocos recursos. Sobre la base de un modelo de aproximación formal previamente evaluado bajo condiciones de amplia disponibilidad de recursos de entrenamiento y validación, estudiamos la confiabilidad de dicho enfoque en un entorno operativo diferente y mucho más exigente. Utilizando como caso de estudio la generación de etiquetadores para el gallego, una lengua perteneciente al grupo ibero-romance occidental, los resultados experimentales son consistentes con nuestras expectativas.
Descripción
La reciente tendencia hacia la aplicación de técnicas estructuradas profundas ha revelado los límites de los modelos enormes en el procesamiento del lenguaje natural. Esto ha reavivado el interés en los algoritmos tradicionales de aprendizaje automático, que han demostrado seguir siendo competitivos en ciertos contextos, especialmente en entornos con recursos limitados. En paralelo, la selección de modelos se ha convertido en una tarea esencial para mejorar el rendimiento a un costo razonable, aún más cuando hablamos de procesos que involucran dominios donde los recursos de entrenamiento y/o computacionales son escasos. Ante este panorama, evaluamos la estimación temprana de las curvas de aprendizaje como un mecanismo práctico para seleccionar el modelo más apropiado en escenarios caracterizados por el uso de aprendices no profundos en entornos con pocos recursos. Sobre la base de un modelo de aproximación formal previamente evaluado bajo condiciones de amplia disponibilidad de recursos de entrenamiento y validación, estudiamos la confiabilidad de dicho enfoque en un entorno operativo diferente y mucho más exigente. Utilizando como caso de estudio la generación de etiquetadores para el gallego, una lengua perteneciente al grupo ibero-romance occidental, los resultados experimentales son consistentes con nuestras expectativas.