Mitigación de sesgo a través de la generación de datos sintéticos: una revisión
Autores: Shahul Hameed, Mohamed Ashik; Qureshi, Asifa Mehmood; Kaushik, Abhishek
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Mitigación de sesgo a través de la generación de datos sintéticos: una revisión
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Inteligencia artificial
Aplicaciones en salud
Sesgos
Conjuntos de datos
Datos sintéticos
Equidad
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 38
Citaciones: Sin citaciones
La inteligencia artificial (IA) se utiliza ampliamente en aplicaciones de salud para realizar diversas tareas. Aunque estos modelos tienen un gran potencial para mejorar el sistema de salud, también han planteado preocupaciones éticas significativas, incluidos los sesgos que aumentan el riesgo de disparidades de salud en aplicaciones médicas. La subrepresentación de un grupo específico puede llevar a sesgos en los conjuntos de datos que se replican en los modelos de IA. Estos grupos desfavorecidos se ven afectados de manera desproporcionada por los sesgos porque pueden tener previsiones algorítmicas menos precisas o subestimar la necesidad de tratamiento. Una solución para eliminar el sesgo es utilizar muestras sintéticas o datos generados artificialmente para equilibrar los conjuntos de datos. Por lo tanto, el propósito de este estudio es revisar y evaluar cómo se pueden generar y utilizar datos sintéticos para mitigar los sesgos, centrándose específicamente en el ámbito médico. Exploramos artículos revisados por pares de alta calidad que se centraron en la generación de datos sintéticos para eliminar sesgos. Estos estudios fueron seleccionados en función de nuestros criterios de inclusión y exclusión definidos y la calidad del contenido. Los hallazgos revelan que los datos sintéticos generados pueden ayudar a mejorar la precisión y equidad. Sin embargo, la efectividad de los datos sintéticos depende estrechamente de la calidad del proceso de generación de datos y de los conjuntos de datos iniciales utilizados. El estudio también destaca la necesidad de una mejora continua en las técnicas de generación de datos sintéticos y la importancia de las métricas de evaluación para la equidad en los modelos de IA.
Descripción
La inteligencia artificial (IA) se utiliza ampliamente en aplicaciones de salud para realizar diversas tareas. Aunque estos modelos tienen un gran potencial para mejorar el sistema de salud, también han planteado preocupaciones éticas significativas, incluidos los sesgos que aumentan el riesgo de disparidades de salud en aplicaciones médicas. La subrepresentación de un grupo específico puede llevar a sesgos en los conjuntos de datos que se replican en los modelos de IA. Estos grupos desfavorecidos se ven afectados de manera desproporcionada por los sesgos porque pueden tener previsiones algorítmicas menos precisas o subestimar la necesidad de tratamiento. Una solución para eliminar el sesgo es utilizar muestras sintéticas o datos generados artificialmente para equilibrar los conjuntos de datos. Por lo tanto, el propósito de este estudio es revisar y evaluar cómo se pueden generar y utilizar datos sintéticos para mitigar los sesgos, centrándose específicamente en el ámbito médico. Exploramos artículos revisados por pares de alta calidad que se centraron en la generación de datos sintéticos para eliminar sesgos. Estos estudios fueron seleccionados en función de nuestros criterios de inclusión y exclusión definidos y la calidad del contenido. Los hallazgos revelan que los datos sintéticos generados pueden ayudar a mejorar la precisión y equidad. Sin embargo, la efectividad de los datos sintéticos depende estrechamente de la calidad del proceso de generación de datos y de los conjuntos de datos iniciales utilizados. El estudio también destaca la necesidad de una mejora continua en las técnicas de generación de datos sintéticos y la importancia de las métricas de evaluación para la equidad en los modelos de IA.