logo móvil
Contáctanos

Ldashiny: un paquete de R para la revisión exploratoria de literatura científica basado en un modelo probabilístico bayesiano y herramientas de aprendizaje automático

Autores: De la Hoz-M, Javier; Fernández-Gómez, Mª José; Mendes, Susana

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Ldashiny: un paquete de R para la revisión exploratoria de literatura científica basado en un modelo probabilístico bayesiano y herramientas de aprendizaje automático


Categoría

Matemáticas

Subcategoría

Matemáticas generales

Palabras clave

Aplicación de código abierto
LDAShiny
Literatura científica
Algoritmo de asignación de Dirichlet latente
Herramientas de aprendizaje automático
Interactivas
Fáciles de usar
Preprocesamiento
Modelado
Postprocesamiento
Investigadores
Analistas
Entorno R
Revisión de literatura
Scopus
Matriz
Términos
Documentos
Términos únicos
Necesidades computacionales
Temas
Rendimiento de crecimiento
Peso corporal
Metales pesados
Genética
Calidad del agua

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 35

Citaciones: Sin citaciones


Descripción
En este documento proponemos una aplicación de código abierto llamada LDAShiny, que proporciona una interfaz gráfica de usuario para realizar una revisión de la literatura científica utilizando el algoritmo de asignación latente de Dirichlet y herramientas de aprendizaje automático de una manera interactiva y fácil de usar. Los procedimientos implementados se basan en enfoques familiares para modelar temas como el preprocesamiento, modelado y postprocesamiento. La herramienta puede ser utilizada por investigadores o analistas que no están familiarizados con el entorno R. Demostramos la aplicación revisando la literatura publicada en las últimas tres décadas sobre la especie. En total revisamos 6196 resúmenes de artículos registrados en Scopus. LDAShiny nos permitió crear la matriz de términos y documentos. En la fase de preprocesamiento se pasó de 530,143 términos únicos a 3268. Así, con las opciones implementadas se redujo el número de términos únicos, así como las necesidades computacionales. Los resultados mostraron que 14 temas fueron suficientes para describir el corpus del ejemplo utilizado en la demostración. También encontramos que los temas de investigación generales sobre esta especie estaban relacionados con el rendimiento de crecimiento, peso corporal, metales pesados, genética y calidad del agua, entre otros.

Otros recursos que podrían interesarte

Temas Virtualpro