Mejorando la detección de sarcasmo interlingüe mediante un marco de aprendizaje de indicaciones con aumento de datos y aprendizaje contrastivo
Autores: An, Tianbo; Yan, Pingping; Zuo, Jiaai; Jin, Xing; Liu, Mingliang; Wang, Jingrui
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejorando la detección de sarcasmo interlingüe mediante un marco de aprendizaje de indicaciones con aumento de datos y aprendizaje contrastivo
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Tarea de detección de sarcasmo
Aprendizaje profundo
Redes neuronales
Aprendizaje de transferencia interlingüística.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 30
Citaciones: Sin citaciones
Dada su naturaleza intrincada y ambigüedad inherente, los textos sarcásticos a menudo enmascaran emociones más profundas, lo que dificulta discernir los verdaderos sentimientos detrás de las palabras. La propuesta de la tarea de detección de sarcasmo es ayudarnos a comprender de manera más precisa la verdadera intención del hablante. Los métodos avanzados, como el aprendizaje profundo y las redes neuronales, son ampliamente utilizados en el campo de la detección de sarcasmo. Sin embargo, la mayoría de las investigaciones se centran principalmente en textos sarcásticos en inglés, ya que otros idiomas carecen de corpora y conjuntos de datos anotados. Para abordar el desafío de los idiomas de recursos limitados en las tareas de detección de sarcasmo, en este documento se propone un método de aprendizaje de transferencia cruzada cero-shot. El enfoque propuesto se basa en el aprendizaje de indicaciones y tiene como objetivo ayudar al modelo a comprender tareas posteriores a través de indicaciones. Específicamente, el modelo utiliza plantillas de indicaciones para construir datos de entrenamiento en forma de preguntas de tipo cloze y luego los entrena utilizando un modelo de lenguaje pre-entrenado de transferencia cruzada. Combinar la ampliación de datos y el aprendizaje contrastivo puede mejorar aún más la capacidad del modelo para el aprendizaje de transferencia cruzada entre idiomas. Para evaluar el rendimiento del modelo propuesto, utilizamos un conjunto de datos de sarcasmo públicamente accesible en inglés como datos de entrenamiento en un entorno de transferencia cruzada cero-shot. Cuando se prueba con chino como idioma objetivo para la transferencia, nuestro modelo logra puntuaciones F1 del 72.14% y 76.7% en dos conjuntos de datos de prueba, superando significativamente a las líneas base sólidas.
Descripción
Dada su naturaleza intrincada y ambigüedad inherente, los textos sarcásticos a menudo enmascaran emociones más profundas, lo que dificulta discernir los verdaderos sentimientos detrás de las palabras. La propuesta de la tarea de detección de sarcasmo es ayudarnos a comprender de manera más precisa la verdadera intención del hablante. Los métodos avanzados, como el aprendizaje profundo y las redes neuronales, son ampliamente utilizados en el campo de la detección de sarcasmo. Sin embargo, la mayoría de las investigaciones se centran principalmente en textos sarcásticos en inglés, ya que otros idiomas carecen de corpora y conjuntos de datos anotados. Para abordar el desafío de los idiomas de recursos limitados en las tareas de detección de sarcasmo, en este documento se propone un método de aprendizaje de transferencia cruzada cero-shot. El enfoque propuesto se basa en el aprendizaje de indicaciones y tiene como objetivo ayudar al modelo a comprender tareas posteriores a través de indicaciones. Específicamente, el modelo utiliza plantillas de indicaciones para construir datos de entrenamiento en forma de preguntas de tipo cloze y luego los entrena utilizando un modelo de lenguaje pre-entrenado de transferencia cruzada. Combinar la ampliación de datos y el aprendizaje contrastivo puede mejorar aún más la capacidad del modelo para el aprendizaje de transferencia cruzada entre idiomas. Para evaluar el rendimiento del modelo propuesto, utilizamos un conjunto de datos de sarcasmo públicamente accesible en inglés como datos de entrenamiento en un entorno de transferencia cruzada cero-shot. Cuando se prueba con chino como idioma objetivo para la transferencia, nuestro modelo logra puntuaciones F1 del 72.14% y 76.7% en dos conjuntos de datos de prueba, superando significativamente a las líneas base sólidas.