Elevar el estándar en la clasificación de juicios de aceptabilidad: un experimento sobre ItaCoLA utilizando ELECTRA
Autores: Guarasci, Raffaele; Minutolo, Aniello; Buonaiuto, Giuseppe; De Pietro, Giuseppe; Esposito, Massimo
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Elevar el estándar en la clasificación de juicios de aceptabilidad: un experimento sobre ItaCoLA utilizando ELECTRA
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Procesamiento del lenguaje natural
Juicios de aceptabilidad
CoLa
Conjunto de datos de referencia GLUE
Modelo de lenguaje neural
ELECTRA
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 35
Citaciones: Sin citaciones
La tarea de evaluar automáticamente juicios de aceptabilidad ha disfrutado de un éxito creciente en el Procesamiento del Lenguaje Natural, comenzando desde la inclusión del Corpus de Aceptabilidad Lingüística (CoLa) en el conjunto de datos de referencia GLUE. CoLa dio lugar a un hilo que llevó al desarrollo de varios conjuntos de datos similares en diferentes idiomas, ampliando las posibilidades de investigación a muchos idiomas además del inglés. En este estudio, aprovechando el Corpus de Aceptabilidad Lingüística Italiano (ItaCoLA), que comprende casi 10,000 oraciones con juicios de aceptabilidad, proponemos una nueva metodología que utiliza el modelo de lenguaje neuronal ELECTRA. Este enfoque supera las puntuaciones obtenidas de los baselines actuales y demuestra que puede superar las limitaciones específicas del idioma al tratar fenómenos específicos.
Descripción
La tarea de evaluar automáticamente juicios de aceptabilidad ha disfrutado de un éxito creciente en el Procesamiento del Lenguaje Natural, comenzando desde la inclusión del Corpus de Aceptabilidad Lingüística (CoLa) en el conjunto de datos de referencia GLUE. CoLa dio lugar a un hilo que llevó al desarrollo de varios conjuntos de datos similares en diferentes idiomas, ampliando las posibilidades de investigación a muchos idiomas además del inglés. En este estudio, aprovechando el Corpus de Aceptabilidad Lingüística Italiano (ItaCoLA), que comprende casi 10,000 oraciones con juicios de aceptabilidad, proponemos una nueva metodología que utiliza el modelo de lenguaje neuronal ELECTRA. Este enfoque supera las puntuaciones obtenidas de los baselines actuales y demuestra que puede superar las limitaciones específicas del idioma al tratar fenómenos específicos.