Detección de desinformación sobre productos de salud en redes sociales utilizando modelos de lenguaje grandes fundamentados en evidencia biomédica
Autores: Behnamian, Sara; Shahbazi, Zeinab; Shahbazi, Zahra; Jafari, Sadiqa
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Detección de desinformación sobre productos de salud en redes sociales utilizando modelos de lenguaje grandes fundamentados en evidencia biomédica
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Reclamos de salud
Redes sociales
Desinformación
Evidencia biomédica
Categorías de veracidad
Reclamos peligrosos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La difusión de afirmaciones de salud no verificadas sobre medicamentos, suplementos dietéticos y remedios alternativos en las redes sociales plantea una creciente preocupación para la salud pública. En este estudio, presentamos un pipeline de generación aumentada por recuperación (RAG) que utiliza modelos de lenguaje grandes (LLMs) fundamentados en evidencia biomédica de PubMed, informes de eventos adversos de openFDA y hojas informativas sobre suplementos dietéticos del NIH/NCCIH para detectar y clasificar la desinformación sobre productos de salud. Se recopilaron un total de 3493 publicaciones relacionadas con la salud de Reddit (948 publicaciones en 12 subreddits) y YouTube (2545 descripciones de videos y comentarios), de las cuales se extrajeron 8250 afirmaciones estructuradas utilizando Claude Haiku. Cada afirmación se emparejó con evidencia biomédica de tres fuentes autorizadas, logrando una cobertura de evidencia del 79.4%, y se clasificó en una de cinco categorías de veracidad: apoyada (7.0%), no apoyada (59.9%), exagerada (22.4%), contradicha (2.0%) o peligrosa (8.6%), junto con un nivel de riesgo asociado. En general, el 13.5% de las afirmaciones se clasificaron como de alto o crítico riesgo. El análisis entre plataformas mostró que YouTube contenía proporciones más altas de afirmaciones peligrosas (11.3% frente a 2.9%) y exageradas (27.0% frente a 12.4%) que Reddit. En comparación con las líneas base basadas en palabras clave y de transformadores de cero disparos, el pipeline LLM+RAG produjo una clasificación más equilibrada y detallada de afirmaciones no apoyadas, exageradas, contradichas y peligrosas. Los productos más frecuentemente implicados fueron ashwagandha, kratom, aceite de semilla negra, cúrcuma e ivermectina, con afirmaciones de cura de enfermedades mostrando la tasa de clasificación peligrosa más alta (30.1%). Estos resultados asignados por el modelo sugieren que los pipelines de LLM fundamentados en evidencia pueden apoyar la vigilancia de la desinformación en salud, al mismo tiempo que destacan la necesidad de validación experta y una evaluación más amplia entre plataformas.
Descripción
La difusión de afirmaciones de salud no verificadas sobre medicamentos, suplementos dietéticos y remedios alternativos en las redes sociales plantea una creciente preocupación para la salud pública. En este estudio, presentamos un pipeline de generación aumentada por recuperación (RAG) que utiliza modelos de lenguaje grandes (LLMs) fundamentados en evidencia biomédica de PubMed, informes de eventos adversos de openFDA y hojas informativas sobre suplementos dietéticos del NIH/NCCIH para detectar y clasificar la desinformación sobre productos de salud. Se recopilaron un total de 3493 publicaciones relacionadas con la salud de Reddit (948 publicaciones en 12 subreddits) y YouTube (2545 descripciones de videos y comentarios), de las cuales se extrajeron 8250 afirmaciones estructuradas utilizando Claude Haiku. Cada afirmación se emparejó con evidencia biomédica de tres fuentes autorizadas, logrando una cobertura de evidencia del 79.4%, y se clasificó en una de cinco categorías de veracidad: apoyada (7.0%), no apoyada (59.9%), exagerada (22.4%), contradicha (2.0%) o peligrosa (8.6%), junto con un nivel de riesgo asociado. En general, el 13.5% de las afirmaciones se clasificaron como de alto o crítico riesgo. El análisis entre plataformas mostró que YouTube contenía proporciones más altas de afirmaciones peligrosas (11.3% frente a 2.9%) y exageradas (27.0% frente a 12.4%) que Reddit. En comparación con las líneas base basadas en palabras clave y de transformadores de cero disparos, el pipeline LLM+RAG produjo una clasificación más equilibrada y detallada de afirmaciones no apoyadas, exageradas, contradichas y peligrosas. Los productos más frecuentemente implicados fueron ashwagandha, kratom, aceite de semilla negra, cúrcuma e ivermectina, con afirmaciones de cura de enfermedades mostrando la tasa de clasificación peligrosa más alta (30.1%). Estos resultados asignados por el modelo sugieren que los pipelines de LLM fundamentados en evidencia pueden apoyar la vigilancia de la desinformación en salud, al mismo tiempo que destacan la necesidad de validación experta y una evaluación más amplia entre plataformas.