logo móvil
Contáctanos

Probando la Efectividad del Paradigma de Sondeo Diagnóstico en los Árboles Sintácticos Italianos

Autores: Miaschi, Alessio; Alzetta, Chiara; Brunato, Dominique; Dell"Orletta, Felice; Venturi, Giulia

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Probando la Efectividad del Paradigma de Sondeo Diagnóstico en los Árboles Sintácticos Italianos


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje neuronal
MLN
Competencia lingüística
Sondas
Tareas de PLN
BERT

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
El rendimiento excepcional alcanzado recientemente por los modelos de lenguaje neuronal (NLMs) en muchas tareas de procesamiento del lenguaje natural (NLP) ha dirigido el debate hacia la comprensión de si los NLMs aprenden implícitamente la competencia lingüística. Se adoptan frecuentemente sondas, es decir, modelos supervisados entrenados utilizando representaciones de NLM para predecir propiedades lingüísticas, para investigar este tema. Sin embargo, aún se cuestiona si las tareas de clasificación de sondas realmente permiten tal investigación o si simplemente sugieren patrones superficiales en los datos. Este trabajo contribuye a este debate al presentar un enfoque para evaluar la efectividad de un conjunto de tareas de sondeo destinadas a probar el conocimiento lingüístico implícitamente codificado por uno de los NLMs más prominentes, BERT. Con este fin, comparamos el rendimiento de las sondas al predecir valores reales y valores alterados automáticamente de un conjunto de características lingüísticas. Nuestros experimentos se realizaron en italiano y se evaluaron a través de las capas de BERT y para oraciones de diferentes longitudes. Como resultado general, observamos un mayor rendimiento en la predicción de valores reales, lo que sugiere que el modelo de sondeo es sensible a la distorsión de los valores de las características. Sin embargo, nuestros experimentos también mostraron que la longitud de una oración es un factor altamente influyente que puede confundir las predicciones del modelo de sondeo.

Otros recursos que podrían interesarte

Temas Virtualpro