
Imagen. / Unsplash por Bernd Dittrich
2025-03-28
Investigadores proponen solución al sesgo por duplicación de datos en estudios médicos
El artículo “New world of big data—new challenges for evidence synthesis: impact of data duplication on estimates generated by meta-analyses and the development of a framework for its identification and management”, publicado en el Journal of Clinical Epidemiology, aborda el problema de la duplicación de datos en los meta-análisis y sus efectos en la precisión de las estimaciones. Este estudio examina el impacto de la duplicación de datos en los meta-análisis, y especialmente se centra en cómo este fenómeno puede afectar la validez de las conclusiones extraídas a partir de revisiones sistemáticas. Con el crecimiento exponencial de los datos disponibles en el ámbito médico, en particular los registros nacionales e internacionales de salud, los autores exploran cómo la presencia de múltiples registros de los mismos pacientes dentro de diferentes bases de datos puede distorsionar los resultados de los meta-análisis.
El problema de la duplicación de datos es particularmente relevante en estudios sobre eventos tromboembólicos venosos (VTE) después de cirugías metabólicas y bariátricas, donde las bases de datos pueden superponerse sin que los investigadores lo adviertan. Esto genera una subestimación de la incidencia real de VTE, lo que podría afectar la toma de decisiones clínicas y la elaboración de guías médicas.
Resultados clave de la investigación
1. Impacto en las estimaciones de los meta-análisis:
- Se encontró que la duplicación de datos subestima la incidencia de VTE en un 22.06 %, lo que implica que los resultados obtenidos en estudios previos podrían estar subestimando el riesgo real para los pacientes sometidos a estas cirugías.
- Este sesgo puede llevar a que médicos y responsables de políticas de salud tomen decisiones basadas en información incorrecta.
2. Desarrollo de un marco para identificar y manejar la duplicación de datos:
- Los autores proponen una estrategia basada en la comparación de fuentes de datos, períodos de muestreo y criterios de inclusión.
- Este marco permite detectar cuándo múltiples estudios están reportando datos duplicados y cómo ajustar los cálculos en los meta-análisis para obtener resultados más precisos.
3. Falta de diversidad geográfica en las bases de datos analizadas:
- Se evidenció que muchos estudios se basan en registros provenientes de un número limitado de países, lo que puede generar sesgos en la representación de la población mundial.
- La falta de datos provenientes de países de ingresos medios y bajos limita la aplicabilidad de las conclusiones a nivel global.
Este trabajo resulta clave en el panorama académico, pues propone mejorar la precisión de los meta-análisis en el campo de la medicina basada en la evidencia. Al exponer el problema de la duplicación de datos y proponer soluciones, Lock y El Ansari contribuyen a la mejora de la calidad de las revisiones sistemáticas y al desarrollo de políticas de salud más fundamentadas. En un contexto donde los registros electrónicos y las bases de datos masivas están en crecimiento, este estudio resalta la necesidad de implementar estrategias para evitar sesgos en la síntesis de la evidencia científica. Además, sugiere que los investigadores deben ser más rigurosos en la selección de datos para garantizar la validez de sus conclusiones.
Limitaciones y posibles mejoras
1. Dependencia de datos preexistentes:
- El estudio se basa en la revisión de bases de datos existentes, lo que implica que las limitaciones de los registros originales pueden influir en sus hallazgos.
2. Necesidad de validación en otros campos médicos:
- Aunque el trabajo se centra en la cirugía bariátrica y metabólica, sería relevante aplicar este marco de análisis en otras áreas médicas para evaluar si el impacto de la duplicación de datos es similar.
3. Falta de una metodología automatizada para detectar duplicaciones:
- El marco propuesto sigue dependiendo en gran medida de la revisión manual de datos, lo que puede ser un proceso sujeto a errores humanos. La implementación de herramientas de IA podría optimizar la detección de duplicaciones en futuras investigaciones.
Laura Valentina González Pardo
Editorial Assistant
VirtualPro
laura.gonzalez@ingco.co
Referencias:
Lock, M., y El Ansari, W. (2025). New world of big data—new challenges for evidence synthesis: impact of data duplication on estimates generated by meta-analyses and the development of a framework for its identification and management. Journal of Clinical Epidemiology, 179, 111641.

Revista Virtualpro
Publicación virtual académico-científica, indexada a nivel Latinoamérica. Presenta la información de una forma innovadora a través de documentos hipertexto, multimedia e interactivos que complementan el proceso de enseñanza-aprendizaje en diferentes programas académicos relacionados con procesos industriales. Cuenta con un comité editorial y científico internacional ad honorem presente en diferentes países de Latinoamérica.