Un método de identificación basado en similitud semántica para funciones de citación implícitas e información sobre sentimientos
Autores: Malkawi, Rami; Daradkeh, Mohammad; El-Hassan, Ammar; Petrov, Pavel
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Un método de identificación basado en similitud semántica para funciones de citación implícitas e información sobre sentimientos
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Automatizado
Análisis de citas
Calidad científica
Colaboración
Similitudes semánticas
Citas implícitas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El análisis automatizado de citas se está volviendo cada vez más importante para evaluar la calidad científica de las publicaciones e identificar patrones de colaboración entre investigadores. Sin embargo, se ha prestado poca atención al análisis del contenido científico del contexto de las citas. Este estudio presenta un método de detección de citas no supervisado que utiliza similitudes semánticas entre citas y oraciones candidatas para identificar citas implícitas, determinar sus funciones y analizar sus sentimientos. Proponemos diferentes modelos de vectores de documentos basados en pesos TF-IDF y vectores de palabras y los comparamos empíricamente para calcular su similitud semántica. Para validar este modelo para identificar citas implícitas, utilizamos redes neuronales profundas y modelado de temas LDA en dos conjuntos de datos de citas. Los resultados experimentales muestran que los valores F1 para la clasificación de citas implícitas son del 88.60% y del 86.60% cuando los artículos se presentan en forma de resumen y de texto completo, respectivamente. Basado en la función de la cita, los resultados muestran que las citas implícitas proporcionan información de fondo y una base técnica, mientras que las citas explícitas enfatizan la motivación de la investigación y los resultados comparativos. Basado en el sentimiento de la cita, los resultados mostraron que las citas implícitas tendían a describir el contenido de manera objetiva y eran generalmente neutrales, mientras que las citas explícitas tendían a describir el contenido de manera positiva. Este estudio destaca la importancia de identificar citas implícitas para la evaluación de la investigación e ilustra las dificultades que enfrentan los investigadores al analizar el contexto de las citas.
Descripción
El análisis automatizado de citas se está volviendo cada vez más importante para evaluar la calidad científica de las publicaciones e identificar patrones de colaboración entre investigadores. Sin embargo, se ha prestado poca atención al análisis del contenido científico del contexto de las citas. Este estudio presenta un método de detección de citas no supervisado que utiliza similitudes semánticas entre citas y oraciones candidatas para identificar citas implícitas, determinar sus funciones y analizar sus sentimientos. Proponemos diferentes modelos de vectores de documentos basados en pesos TF-IDF y vectores de palabras y los comparamos empíricamente para calcular su similitud semántica. Para validar este modelo para identificar citas implícitas, utilizamos redes neuronales profundas y modelado de temas LDA en dos conjuntos de datos de citas. Los resultados experimentales muestran que los valores F1 para la clasificación de citas implícitas son del 88.60% y del 86.60% cuando los artículos se presentan en forma de resumen y de texto completo, respectivamente. Basado en la función de la cita, los resultados muestran que las citas implícitas proporcionan información de fondo y una base técnica, mientras que las citas explícitas enfatizan la motivación de la investigación y los resultados comparativos. Basado en el sentimiento de la cita, los resultados mostraron que las citas implícitas tendían a describir el contenido de manera objetiva y eran generalmente neutrales, mientras que las citas explícitas tendían a describir el contenido de manera positiva. Este estudio destaca la importancia de identificar citas implícitas para la evaluación de la investigación e ilustra las dificultades que enfrentan los investigadores al analizar el contexto de las citas.