Un estudio sobre enfoques de fusión de rankings para la recuperación de publicaciones médicas
Autores: Clipa, Teofan; Di Nunzio, Giorgio Maria
Idioma: Inglés
Editor: MDPI
Año: 2020
Acceso abierto
Artículo científico
2020
Un estudio sobre enfoques de fusión de rankings para la recuperación de publicaciones médicas
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Enfoques
Recuperación de publicaciones médicas
Revisión Asistida por Tecnología
TAR
Enfoques semiautomáticos
Modelos de última generación
Esquemas de ponderación
Expansión de consultas
Retroalimentación de relevancia
Representación de incrustaciones de palabras
Enfoques de fusión de clasificación
Foro de Evaluación de Conferencias y Laboratorios
CLEF
Tareas de eSalud
Análisis estadístico
Preprocesamiento de texto
Esquema de ponderación.
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En este trabajo, comparamos y analizamos una variedad de enfoques en la tarea de recuperación de publicaciones médicas y, en particular, para la tarea de Revisión Asistida por Tecnología (TAR). Este problema consiste en el proceso de recopilar artículos que resumen toda la evidencia que se ha publicado sobre un determinado tema médico. Esta tarea requiere largas sesiones de búsqueda por parte de expertos en el campo de la medicina. Por esta razón, los enfoques semiautomáticos son esenciales para apoyar este tipo de búsquedas cuando la cantidad de datos supera los límites de los usuarios. En este artículo, utilizamos modelos de vanguardia y esquemas de ponderación con diferentes tipos de preprocesamiento, así como enfoques de expansión de consultas (QE) y retroalimentación de relevancia (RF) para estudiar la mejor combinación para esta tarea en particular. También probamos la representación de incrustaciones de palabras de documentos y consultas, además de tres enfoques diferentes de fusión de clasificación para ver si las ejecuciones combinadas funcionan mejor que los modelos individuales. Para hacer que nuestros resultados sean reproducibles, hemos utilizado la colección proporcionada por el Foro de Evaluación de Conferencias y Laboratorios (CLEF) en las tareas de eHealth. La expansión de consultas y la retroalimentación de relevancia mejoran enormemente el rendimiento, mientras que la fusión de diferentes clasificaciones no funciona bien en esta tarea. El análisis estadístico mostró que, en general, el rendimiento del sistema no depende mucho del tipo de preprocesamiento de texto, sino de qué esquema de ponderación se aplica.
Descripción
En este trabajo, comparamos y analizamos una variedad de enfoques en la tarea de recuperación de publicaciones médicas y, en particular, para la tarea de Revisión Asistida por Tecnología (TAR). Este problema consiste en el proceso de recopilar artículos que resumen toda la evidencia que se ha publicado sobre un determinado tema médico. Esta tarea requiere largas sesiones de búsqueda por parte de expertos en el campo de la medicina. Por esta razón, los enfoques semiautomáticos son esenciales para apoyar este tipo de búsquedas cuando la cantidad de datos supera los límites de los usuarios. En este artículo, utilizamos modelos de vanguardia y esquemas de ponderación con diferentes tipos de preprocesamiento, así como enfoques de expansión de consultas (QE) y retroalimentación de relevancia (RF) para estudiar la mejor combinación para esta tarea en particular. También probamos la representación de incrustaciones de palabras de documentos y consultas, además de tres enfoques diferentes de fusión de clasificación para ver si las ejecuciones combinadas funcionan mejor que los modelos individuales. Para hacer que nuestros resultados sean reproducibles, hemos utilizado la colección proporcionada por el Foro de Evaluación de Conferencias y Laboratorios (CLEF) en las tareas de eHealth. La expansión de consultas y la retroalimentación de relevancia mejoran enormemente el rendimiento, mientras que la fusión de diferentes clasificaciones no funciona bien en esta tarea. El análisis estadístico mostró que, en general, el rendimiento del sistema no depende mucho del tipo de preprocesamiento de texto, sino de qué esquema de ponderación se aplica.