Generación de Preguntas Visuales Orientadas a Objetivos a partir de Imágenes de Radiología

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Generación de Preguntas Visuales Orientadas a Objetivos a partir de Imágenes de Radiología

Autores: Sarrouti, Mourad; Ben Abacha, Asma; Demner-Fushman, Dina

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico

2021

Generación de Preguntas Visuales Orientadas a Objetivos a partir de Imágenes de Radiología

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Enfoque

Vqgrad

Imágenes

Preguntas

Dominio médico

Aumento de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

La generación de preguntas visuales (VQG) a partir de imágenes es un tema de investigación en auge en los campos del procesamiento del lenguaje natural y la visión por computadora. Aunque ha habido algunos esfuerzos recientes para generar preguntas a partir de imágenes en el dominio abierto, la tarea de VQG en el dominio médico no ha sido bien estudiada hasta ahora debido a la falta de datos etiquetados. En este artículo, introducimos un enfoque de VQG orientado a objetivos para imágenes de radiología llamado VQGRaD que genera preguntas dirigidas a aspectos específicos de la imagen, como la modalidad y la anomalía. En particular, estudiamos la generación de preguntas en lenguaje natural basadas en el contenido visual de la imagen y en información adicional como el pie de foto de la imagen y la categoría de la pregunta. VQGRaD codifica los vectores densos de diferentes entradas en dos espacios latentes, lo que permite generar, para una categoría de pregunta específica, preguntas relevantes sobre las imágenes, con o sin sus pies de foto. También exploramos el impacto de la incorporación de conocimiento del dominio (por ejemplo, entidades médicas y tipos semánticos) y técnicas de aumento de datos en la generación de preguntas visuales en el dominio médico. Los experimentos realizados en el conjunto de datos VQA-RAD de preguntas visuales clínicas mostraron que VQGRaD alcanza un puntaje BLEU del 61.86% y supera a líneas base sólidas. También realizamos una evaluación humana a ciegas de la gramática, fluidez y relevancia de las preguntas generadas. La evaluación humana demostró la mejor calidad de las salidas de VQGRaD y mostró que la incorporación de entidades médicas mejora la calidad de las preguntas generadas. Utilizando los datos de prueba y el proceso de evaluación del desafío VQA-Med de ImageCLEF 2020, encontramos que confiar en la técnica de aumento de datos propuesta para generar nuevas muestras de entrenamiento aplicando diferentes tipos de transformaciones puede mitigar la falta de datos, evitar el sobreajuste y traer una mejora sustancial en la VQG médica.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro