Métodos de Pocas Muestras para el Análisis de Sentimientos a Nivel de Aspecto
Autores: Wawer, Aleksander
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Métodos de Pocas Muestras para el Análisis de Sentimientos a Nivel de Aspecto
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Enfoques
Dominio cruzado
Clasificación de pocos ejemplos
Aspectos de sentimiento
Modelos de lenguaje
NNShot
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este artículo, exploramos los enfoques al problema de la clasificación de aspectos de sentimiento en escenarios de pocos ejemplos y dominios cruzados. Por pocos ejemplos y dominios cruzados, nos referimos a un entorno donde el modelo se entrena con grandes datos en un dominio (por ejemplo, reseñas de hoteles) y se pretende que funcione en otro (por ejemplo, reseñas de restaurantes) con solo unos pocos ejemplos etiquetados en el dominio objetivo. Comenzamos con modelos de lenguaje monolingües preentrenados. Usando el conjunto de datos en polaco AspectEmo, comparamos el entrenamiento del modelo utilizando el aprendizaje estándar basado en gradientes con un enfoque de cero ejemplos y dos métodos dedicados de pocos ejemplos: ProtoNet y NNShot. Encontramos que ambos métodos dedicados son muy superiores tanto al aprendizaje por gradientes como al enfoque de cero ejemplos, con una pequeña ventaja para NNShot. En general, encontramos que el enfoque de pocos ejemplos es una alternativa convincente, logrando una sorprendente cantidad de rendimiento en comparación con el entrenamiento por gradientes en datos de tamaño completo.
Descripción
En este artículo, exploramos los enfoques al problema de la clasificación de aspectos de sentimiento en escenarios de pocos ejemplos y dominios cruzados. Por pocos ejemplos y dominios cruzados, nos referimos a un entorno donde el modelo se entrena con grandes datos en un dominio (por ejemplo, reseñas de hoteles) y se pretende que funcione en otro (por ejemplo, reseñas de restaurantes) con solo unos pocos ejemplos etiquetados en el dominio objetivo. Comenzamos con modelos de lenguaje monolingües preentrenados. Usando el conjunto de datos en polaco AspectEmo, comparamos el entrenamiento del modelo utilizando el aprendizaje estándar basado en gradientes con un enfoque de cero ejemplos y dos métodos dedicados de pocos ejemplos: ProtoNet y NNShot. Encontramos que ambos métodos dedicados son muy superiores tanto al aprendizaje por gradientes como al enfoque de cero ejemplos, con una pequeña ventaja para NNShot. En general, encontramos que el enfoque de pocos ejemplos es una alternativa convincente, logrando una sorprendente cantidad de rendimiento en comparación con el entrenamiento por gradientes en datos de tamaño completo.