Generando paráfrasis utilizando recocido simulado para oraciones de citas
Autores: Ilyas, Ridwan; Khodra, Masayu Leylia; Munir, Rinaldi; Mandala, Rila; Widyantoro, Dwi Hendratmo
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Generando paráfrasis utilizando recocido simulado para oraciones de citas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Generador de paráfrasis
Oraciones de cita
Modelo StoPGEN
Similitud semántica
Divergencia léxica
Función objetivo
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El generador de paráfrasis para oraciones de citas se utiliza para producir varias alternativas de oraciones para evitar el plagio. Además, los resultados de la generación deben prestar atención a los estándares de similitud semántica y divergencia léxica. Este estudio propuso el modelo StoPGEN como un algoritmo para generar oraciones de paráfrasis de citas con salida estocástica. El proceso de generación está guiado por una función objetivo utilizando un algoritmo de recocido simulado para mantener las propiedades de similitud semántica y divergencia léxica. La función objetivo se crea combinando los dos factores que mantienen estas propiedades. Este estudio combinó las puntuaciones METEOR y PINC en una función de ponderación lineal que se puede ajustar según su tendencia de valor en una de las funciones de matriz. Se utilizó el conjunto de datos de oraciones de citas que habían sido etiquetadas con paráfrasis para probar StoPGEN y otros modelos para comparación. El modelo StoPGEN, con el conjunto de datos de oraciones de citas, produjo una puntuación BLEU de 55.37, superando el método LSTM bidireccional con un valor de 28.93. StoPGEN también fue probado utilizando datos de Quora al cambiar la fuente de idioma en la sección de arquitectura, lo que resultó en una puntuación BLEU de 22.37, superando a UPSA 18.21. Además, los resultados de la evaluación cualitativa de la generación de oraciones de citas basados en los encuestados obtuvieron un valor de aceptación de 50.80.
Descripción
El generador de paráfrasis para oraciones de citas se utiliza para producir varias alternativas de oraciones para evitar el plagio. Además, los resultados de la generación deben prestar atención a los estándares de similitud semántica y divergencia léxica. Este estudio propuso el modelo StoPGEN como un algoritmo para generar oraciones de paráfrasis de citas con salida estocástica. El proceso de generación está guiado por una función objetivo utilizando un algoritmo de recocido simulado para mantener las propiedades de similitud semántica y divergencia léxica. La función objetivo se crea combinando los dos factores que mantienen estas propiedades. Este estudio combinó las puntuaciones METEOR y PINC en una función de ponderación lineal que se puede ajustar según su tendencia de valor en una de las funciones de matriz. Se utilizó el conjunto de datos de oraciones de citas que habían sido etiquetadas con paráfrasis para probar StoPGEN y otros modelos para comparación. El modelo StoPGEN, con el conjunto de datos de oraciones de citas, produjo una puntuación BLEU de 55.37, superando el método LSTM bidireccional con un valor de 28.93. StoPGEN también fue probado utilizando datos de Quora al cambiar la fuente de idioma en la sección de arquitectura, lo que resultó en una puntuación BLEU de 22.37, superando a UPSA 18.21. Además, los resultados de la evaluación cualitativa de la generación de oraciones de citas basados en los encuestados obtuvieron un valor de aceptación de 50.80.