Detección de desinformación sobre productos de salud en redes sociales utilizando modelos de lenguaje grandes fundamentados en evidencia biomédica

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

Detección de desinformación sobre productos de salud en redes sociales utilizando modelos de lenguaje grandes fundamentados en evidencia biomédica

Autores: Behnamian, Sara; Shahbazi, Zeinab; Shahbazi, Zahra; Jafari, Sadiqa

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico

2026

Detección de desinformación sobre productos de salud en redes sociales utilizando modelos de lenguaje grandes fundamentados en evidencia biomédica

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Reclamos de salud

Redes sociales

Desinformación

Evidencia biomédica

Categorías de veracidad

Reclamos peligrosos

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

La difusión de afirmaciones de salud no verificadas sobre medicamentos, suplementos dietéticos y remedios alternativos en las redes sociales plantea una creciente preocupación para la salud pública. En este estudio, presentamos un pipeline de generación aumentada por recuperación (RAG) que utiliza modelos de lenguaje grandes (LLMs) fundamentados en evidencia biomédica de PubMed, informes de eventos adversos de openFDA y hojas informativas sobre suplementos dietéticos del NIH/NCCIH para detectar y clasificar la desinformación sobre productos de salud. Se recopilaron un total de 3493 publicaciones relacionadas con la salud de Reddit (948 publicaciones en 12 subreddits) y YouTube (2545 descripciones de videos y comentarios), de las cuales se extrajeron 8250 afirmaciones estructuradas utilizando Claude Haiku. Cada afirmación se emparejó con evidencia biomédica de tres fuentes autorizadas, logrando una cobertura de evidencia del 79.4%, y se clasificó en una de cinco categorías de veracidad: apoyada (7.0%), no apoyada (59.9%), exagerada (22.4%), contradicha (2.0%) o peligrosa (8.6%), junto con un nivel de riesgo asociado. En general, el 13.5% de las afirmaciones se clasificaron como de alto o crítico riesgo. El análisis entre plataformas mostró que YouTube contenía proporciones más altas de afirmaciones peligrosas (11.3% frente a 2.9%) y exageradas (27.0% frente a 12.4%) que Reddit. En comparación con las líneas base basadas en palabras clave y de transformadores de cero disparos, el pipeline LLM+RAG produjo una clasificación más equilibrada y detallada de afirmaciones no apoyadas, exageradas, contradichas y peligrosas. Los productos más frecuentemente implicados fueron ashwagandha, kratom, aceite de semilla negra, cúrcuma e ivermectina, con afirmaciones de cura de enfermedades mostrando la tasa de clasificación peligrosa más alta (30.1%). Estos resultados asignados por el modelo sugieren que los pipelines de LLM fundamentados en evidencia pueden apoyar la vigilancia de la desinformación en salud, al mismo tiempo que destacan la necesidad de validación experta y una evaluación más amplia entre plataformas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro