logo móvil
Contáctanos

Generación de Preguntas Visuales Orientadas a Objetivos a partir de Imágenes de Radiología

Autores: Sarrouti, Mourad; Ben Abacha, Asma; Demner-Fushman, Dina

Idioma: Inglés

Editor: MDPI

Año: 2021

Descargar PDF

Acceso abierto

Artículo científico
2021

Generación de Preguntas Visuales Orientadas a Objetivos a partir de Imágenes de Radiología


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Enfoque
Vqgrad
Imágenes
Preguntas
Dominio médico
Aumento de datos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La generación de preguntas visuales (VQG) a partir de imágenes es un tema de investigación en auge en los campos del procesamiento del lenguaje natural y la visión por computadora. Aunque ha habido algunos esfuerzos recientes para generar preguntas a partir de imágenes en el dominio abierto, la tarea de VQG en el dominio médico no ha sido bien estudiada hasta ahora debido a la falta de datos etiquetados. En este artículo, introducimos un enfoque de VQG orientado a objetivos para imágenes de radiología llamado VQGRaD que genera preguntas dirigidas a aspectos específicos de la imagen, como la modalidad y la anomalía. En particular, estudiamos la generación de preguntas en lenguaje natural basadas en el contenido visual de la imagen y en información adicional como el pie de foto de la imagen y la categoría de la pregunta. VQGRaD codifica los vectores densos de diferentes entradas en dos espacios latentes, lo que permite generar, para una categoría de pregunta específica, preguntas relevantes sobre las imágenes, con o sin sus pies de foto. También exploramos el impacto de la incorporación de conocimiento del dominio (por ejemplo, entidades médicas y tipos semánticos) y técnicas de aumento de datos en la generación de preguntas visuales en el dominio médico. Los experimentos realizados en el conjunto de datos VQA-RAD de preguntas visuales clínicas mostraron que VQGRaD alcanza un puntaje BLEU del 61.86% y supera a líneas base sólidas. También realizamos una evaluación humana a ciegas de la gramática, fluidez y relevancia de las preguntas generadas. La evaluación humana demostró la mejor calidad de las salidas de VQGRaD y mostró que la incorporación de entidades médicas mejora la calidad de las preguntas generadas. Utilizando los datos de prueba y el proceso de evaluación del desafío VQA-Med de ImageCLEF 2020, encontramos que confiar en la técnica de aumento de datos propuesta para generar nuevas muestras de entrenamiento aplicando diferentes tipos de transformaciones puede mitigar la falta de datos, evitar el sobreajuste y traer una mejora sustancial en la VQG médica.

Otros recursos que podrían interesarte

Temas Virtualpro