Análisis cientométrico y clasificación de la investigación utilizando redes neuronales convolucionales: un estudio de caso en ciencia de datos y análisis
Autores: Daradkeh, Mohammad; Abualigah, Laith; Atalla, Shadi; Mansoor, Wathiq
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Análisis cientométrico y clasificación de la investigación utilizando redes neuronales convolucionales: un estudio de caso en ciencia de datos y análisis
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Desarrollo
Análisis cientométrico
Redes neuronales convolucionales
Clasificación
Aprendizaje profundo
Literatura
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 36
Citaciones: Sin citaciones
Con el creciente desarrollo de la literatura publicada, los métodos de clasificación basados en información bibliométrica y enfoques tradicionales de aprendizaje automático encuentran desafíos de rendimiento relacionados con clasificaciones demasiado generales y baja precisión. Este estudio presenta un enfoque de aprendizaje profundo para el análisis cientométrico y la clasificación de la literatura científica basado en redes neuronales convolucionales (CNN). Tres dimensiones, es decir, características de publicación, características de autor y características de contenido, se dividieron en características explícitas e implícitas para formar un conjunto de términos cientométricos a través de la extracción de características explícitas y el mapeo de características implícitas. Los vectores de términos cientométricos ponderados se ajustan en un modelo de CNN para lograr una clasificación de doble etiqueta de la literatura basada en el contenido y los métodos de investigación. La efectividad del modelo propuesto se demuestra utilizando un ejemplo de aplicación de la literatura de ciencia de datos y análisis. Los resultados empíricos muestran que el modelo de clasificación cientométrica propuesto en este estudio tiene un mejor rendimiento que los métodos de clasificación de aprendizaje automático comparables en cuanto a precisión, reconocimiento y puntuación F1. También exhibe una mayor precisión que la clasificación de aprendizaje profundo basada únicamente en características explícitas y dominantes. Este estudio proporciona una guía metodológica para la clasificación detallada de la literatura científica y una investigación exhaustiva de su práctica.
Descripción
Con el creciente desarrollo de la literatura publicada, los métodos de clasificación basados en información bibliométrica y enfoques tradicionales de aprendizaje automático encuentran desafíos de rendimiento relacionados con clasificaciones demasiado generales y baja precisión. Este estudio presenta un enfoque de aprendizaje profundo para el análisis cientométrico y la clasificación de la literatura científica basado en redes neuronales convolucionales (CNN). Tres dimensiones, es decir, características de publicación, características de autor y características de contenido, se dividieron en características explícitas e implícitas para formar un conjunto de términos cientométricos a través de la extracción de características explícitas y el mapeo de características implícitas. Los vectores de términos cientométricos ponderados se ajustan en un modelo de CNN para lograr una clasificación de doble etiqueta de la literatura basada en el contenido y los métodos de investigación. La efectividad del modelo propuesto se demuestra utilizando un ejemplo de aplicación de la literatura de ciencia de datos y análisis. Los resultados empíricos muestran que el modelo de clasificación cientométrica propuesto en este estudio tiene un mejor rendimiento que los métodos de clasificación de aprendizaje automático comparables en cuanto a precisión, reconocimiento y puntuación F1. También exhibe una mayor precisión que la clasificación de aprendizaje profundo basada únicamente en características explícitas y dominantes. Este estudio proporciona una guía metodológica para la clasificación detallada de la literatura científica y una investigación exhaustiva de su práctica.