Un Pipeline Híbrido Neuro-Simbólico para la Resolución de Correferencias y el Análisis Semántico Basado en AMR
Autores: Papakostas, Christos; Troussas, Christos; Krouska, Akrivi; Sgouropoulou, Cleo
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Un Pipeline Híbrido Neuro-Simbólico para la Resolución de Correferencias y el Análisis Semántico Basado en AMR
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de lenguaje grandes
Procesamiento de lenguaje natural
Resolución de co-referencias
Inferencia semántica
Arquitectura neuronal
Razonamiento simbólico
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los Modelos de Lenguaje Grande (LLMs) han transformado el Procesamiento del Lenguaje Natural (NLP), sin embargo, continúan teniendo dificultades con la comprensión semántica profunda, particularmente en tareas como la resolución de correferencias y la inferencia semántica estructurada. Este estudio presenta un pipeline neuro-simbólico híbrido que combina la codificación contextual basada en transformadores con la resolución simbólica de correferencias y el análisis de Representación de Significado Abstracto (AMR) para mejorar la comprensión del lenguaje natural. El pipeline resuelve la ambigüedad referencial utilizando un módulo de correferencia basado en reglas y genera gráficos semánticos a partir de entradas desambiguadas utilizando un analizador simbólico de AMR. Los experimentos en conjuntos de datos de referencia públicos - PreCo para correferencia y el Subconjunto Público AMR 3.0 para análisis semántico - demuestran que nuestro modelo híbrido supera consistentemente a las líneas base solo simbólicas y solo neuronales. El modelo logró ganancias notables en las puntuaciones F1 para correferencia (72.4%) y puntuaciones Smatch para análisis semántico (76.5%), con mejoras significativas en la resolución de pronombres y etiquetado de roles semánticos. Además de la precisión, el pipeline ofrece interpretabilidad a través de componentes modulares y salidas intermedias auditables, lo que lo hace adecuado para aplicaciones de alto riesgo que requieren transparencia. Estos hallazgos muestran que la integración del razonamiento simbólico dentro de la arquitectura neuronal ofrece un camino robusto y práctico para superar las limitaciones clave de los LLMs actuales en tareas de NLP a nivel semántico.
Descripción
Los Modelos de Lenguaje Grande (LLMs) han transformado el Procesamiento del Lenguaje Natural (NLP), sin embargo, continúan teniendo dificultades con la comprensión semántica profunda, particularmente en tareas como la resolución de correferencias y la inferencia semántica estructurada. Este estudio presenta un pipeline neuro-simbólico híbrido que combina la codificación contextual basada en transformadores con la resolución simbólica de correferencias y el análisis de Representación de Significado Abstracto (AMR) para mejorar la comprensión del lenguaje natural. El pipeline resuelve la ambigüedad referencial utilizando un módulo de correferencia basado en reglas y genera gráficos semánticos a partir de entradas desambiguadas utilizando un analizador simbólico de AMR. Los experimentos en conjuntos de datos de referencia públicos - PreCo para correferencia y el Subconjunto Público AMR 3.0 para análisis semántico - demuestran que nuestro modelo híbrido supera consistentemente a las líneas base solo simbólicas y solo neuronales. El modelo logró ganancias notables en las puntuaciones F1 para correferencia (72.4%) y puntuaciones Smatch para análisis semántico (76.5%), con mejoras significativas en la resolución de pronombres y etiquetado de roles semánticos. Además de la precisión, el pipeline ofrece interpretabilidad a través de componentes modulares y salidas intermedias auditables, lo que lo hace adecuado para aplicaciones de alto riesgo que requieren transparencia. Estos hallazgos muestran que la integración del razonamiento simbólico dentro de la arquitectura neuronal ofrece un camino robusto y práctico para superar las limitaciones clave de los LLMs actuales en tareas de NLP a nivel semántico.