Evaluación de cobertura de corrección para responder preguntas médicas de opción múltiple basada en el marco de predicción conformal mejorado
Autores: Ke, Yusong; Lin, Hongru; Ruan, Yuting; Tang, Junya; Li, Li
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Evaluación de cobertura de corrección para responder preguntas médicas de opción múltiple basada en el marco de predicción conformal mejorado
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Modelos de lenguaje grandes
Respuesta a preguntas médicas
Predicción conforme
Marco mejorado
De opción múltiple
Control de riesgos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 24
Citaciones: Sin citaciones
Los modelos de lenguaje grandes (LLMs) son cada vez más adoptados en escenarios de preguntas y respuestas médicas. Sin embargo, se ha demostrado que los LLMs generan alucinaciones e información no factual, socavando su confiabilidad en tareas médicas de alto riesgo. La Predicción Conformal (CP) es ahora reconocida como un marco robusto dentro del ámbito más amplio del aprendizaje automático, ofreciendo garantías estadísticamente rigurosas de cobertura marginal (promedio) para conjuntos de predicción. Sin embargo, la aplicabilidad de CP en preguntas y respuestas médicas aún está por explorarse.
Descripción
Los modelos de lenguaje grandes (LLMs) son cada vez más adoptados en escenarios de preguntas y respuestas médicas. Sin embargo, se ha demostrado que los LLMs generan alucinaciones e información no factual, socavando su confiabilidad en tareas médicas de alto riesgo. La Predicción Conformal (CP) es ahora reconocida como un marco robusto dentro del ámbito más amplio del aprendizaje automático, ofreciendo garantías estadísticamente rigurosas de cobertura marginal (promedio) para conjuntos de predicción. Sin embargo, la aplicabilidad de CP en preguntas y respuestas médicas aún está por explorarse.