Mejorando la respuesta a preguntas biomédicas con modelos de lenguaje grandes
Autores: Yang, Hua; Li, Shilong; Gonçalves, Teresa
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mejorando la respuesta a preguntas biomédicas con modelos de lenguaje grandes
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Campo
Recuperación de información
Respuesta a preguntas biomédicas
Dominios de atención médica
Modelos de lenguaje grandes
Enfoque de recuperación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
En el campo de la Recuperación de Información, la respuesta a preguntas biomédicas es una tarea especializada que se centra en responder preguntas relacionadas con los dominios médico y de atención sanitaria. El objetivo es proporcionar respuestas precisas y relevantes a las consultas planteadas relacionadas con condiciones médicas, tratamientos, procedimientos, medicamentos y otros temas relacionados con la atención sanitaria. Los modelos bien diseñados deberían recuperar pasajes relevantes de manera eficiente. Los modelos de recuperación temprana pueden recuperar pasajes rápidamente, pero a menudo con baja precisión. En contraste, los Modelos de Lenguaje Grande desarrollados recientemente pueden recuperar documentos con alta precisión, pero a un ritmo más lento. Para abordar este problema, proponemos un enfoque de recuperación en dos etapas que inicialmente utiliza BM25 para una búsqueda preliminar para identificar documentos candidatos potenciales; posteriormente, un Modelo de Lenguaje Grande se ajusta para evaluar la relevancia de los pares consulta-documento. Los resultados experimentales indican que nuestro enfoque logra un rendimiento comparable en los conjuntos de datos BioASQ y TREC-COVID.
Descripción
En el campo de la Recuperación de Información, la respuesta a preguntas biomédicas es una tarea especializada que se centra en responder preguntas relacionadas con los dominios médico y de atención sanitaria. El objetivo es proporcionar respuestas precisas y relevantes a las consultas planteadas relacionadas con condiciones médicas, tratamientos, procedimientos, medicamentos y otros temas relacionados con la atención sanitaria. Los modelos bien diseñados deberían recuperar pasajes relevantes de manera eficiente. Los modelos de recuperación temprana pueden recuperar pasajes rápidamente, pero a menudo con baja precisión. En contraste, los Modelos de Lenguaje Grande desarrollados recientemente pueden recuperar documentos con alta precisión, pero a un ritmo más lento. Para abordar este problema, proponemos un enfoque de recuperación en dos etapas que inicialmente utiliza BM25 para una búsqueda preliminar para identificar documentos candidatos potenciales; posteriormente, un Modelo de Lenguaje Grande se ajusta para evaluar la relevancia de los pares consulta-documento. Los resultados experimentales indican que nuestro enfoque logra un rendimiento comparable en los conjuntos de datos BioASQ y TREC-COVID.