logo móvil
Contáctanos

Mitigación de sesgo a través de la generación de datos sintéticos: una revisión

Autores: Shahul Hameed, Mohamed Ashik; Qureshi, Asifa Mehmood; Kaushik, Abhishek

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico
2024

Mitigación de sesgo a través de la generación de datos sintéticos: una revisión


Categoría

Ingeniería y Tecnología

Subcategoría

Ingeniería Eléctrica y Electrónica

Palabras clave

Inteligencia artificial
Aplicaciones en salud
Sesgos
Conjuntos de datos
Datos sintéticos
Equidad

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 38

Citaciones: Sin citaciones


Descripción
La inteligencia artificial (IA) se utiliza ampliamente en aplicaciones de salud para realizar diversas tareas. Aunque estos modelos tienen un gran potencial para mejorar el sistema de salud, también han planteado preocupaciones éticas significativas, incluidos los sesgos que aumentan el riesgo de disparidades de salud en aplicaciones médicas. La subrepresentación de un grupo específico puede llevar a sesgos en los conjuntos de datos que se replican en los modelos de IA. Estos grupos desfavorecidos se ven afectados de manera desproporcionada por los sesgos porque pueden tener previsiones algorítmicas menos precisas o subestimar la necesidad de tratamiento. Una solución para eliminar el sesgo es utilizar muestras sintéticas o datos generados artificialmente para equilibrar los conjuntos de datos. Por lo tanto, el propósito de este estudio es revisar y evaluar cómo se pueden generar y utilizar datos sintéticos para mitigar los sesgos, centrándose específicamente en el ámbito médico. Exploramos artículos revisados por pares de alta calidad que se centraron en la generación de datos sintéticos para eliminar sesgos. Estos estudios fueron seleccionados en función de nuestros criterios de inclusión y exclusión definidos y la calidad del contenido. Los hallazgos revelan que los datos sintéticos generados pueden ayudar a mejorar la precisión y equidad. Sin embargo, la efectividad de los datos sintéticos depende estrechamente de la calidad del proceso de generación de datos y de los conjuntos de datos iniciales utilizados. El estudio también destaca la necesidad de una mejora continua en las técnicas de generación de datos sintéticos y la importancia de las métricas de evaluación para la equidad en los modelos de IA.

Otros recursos que podrían interesarte

Temas Virtualpro