Analizando la equidad de los modelos de visión por computadora y procesamiento del lenguaje natural
Autores: Rashed, Ahmed; Kallich, Abdelkrim; Eltayeb, Mohamed
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Analizando la equidad de los modelos de visión por computadora y procesamiento del lenguaje natural
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Aprendizaje automático
Equidad
Sesgo
Algoritmos
Conjuntos de datos
Evaluación
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Los algoritmos de aprendizaje automático (ML) desempeñan un papel crítico en la toma de decisiones en diversos ámbitos, como la salud, las finanzas, la educación y la aplicación de la ley. Sin embargo, las preocupaciones sobre la equidad y el sesgo en estos sistemas han planteado importantes desafíos éticos y sociales. Para abordar estos desafíos, esta investigación utiliza dos bibliotecas de equidad prominentes, Fairlearn de Microsoft y AIF360 de IBM. Estas bibliotecas ofrecen marcos integrales para el análisis de equidad, proporcionando herramientas para evaluar métricas de equidad, visualizar resultados e implementar algoritmos de mitigación de sesgos. El estudio se centra en evaluar y mitigar sesgos en conjuntos de datos no estructurados utilizando modelos de Visión por Computadora (CV) y Procesamiento de Lenguaje Natural (NLP). El objetivo principal es presentar un análisis comparativo del rendimiento de los algoritmos de mitigación de las dos bibliotecas de equidad. Este análisis implica aplicar los algoritmos de forma individual, uno a la vez, en una de las etapas del ciclo de vida del ML, preprocesamiento, procesamiento o postprocesamiento, así como secuencialmente en más de una etapa. Los resultados revelan que algunas aplicaciones secuenciales mejoran el rendimiento de los algoritmos de mitigación al reducir efectivamente el sesgo mientras se mantiene el rendimiento del modelo. Se eligieron conjuntos de datos disponibles públicamente de Kaggle para esta investigación, proporcionando un contexto práctico para evaluar la equidad en flujos de trabajo de aprendizaje automático del mundo real.
Descripción
Los algoritmos de aprendizaje automático (ML) desempeñan un papel crítico en la toma de decisiones en diversos ámbitos, como la salud, las finanzas, la educación y la aplicación de la ley. Sin embargo, las preocupaciones sobre la equidad y el sesgo en estos sistemas han planteado importantes desafíos éticos y sociales. Para abordar estos desafíos, esta investigación utiliza dos bibliotecas de equidad prominentes, Fairlearn de Microsoft y AIF360 de IBM. Estas bibliotecas ofrecen marcos integrales para el análisis de equidad, proporcionando herramientas para evaluar métricas de equidad, visualizar resultados e implementar algoritmos de mitigación de sesgos. El estudio se centra en evaluar y mitigar sesgos en conjuntos de datos no estructurados utilizando modelos de Visión por Computadora (CV) y Procesamiento de Lenguaje Natural (NLP). El objetivo principal es presentar un análisis comparativo del rendimiento de los algoritmos de mitigación de las dos bibliotecas de equidad. Este análisis implica aplicar los algoritmos de forma individual, uno a la vez, en una de las etapas del ciclo de vida del ML, preprocesamiento, procesamiento o postprocesamiento, así como secuencialmente en más de una etapa. Los resultados revelan que algunas aplicaciones secuenciales mejoran el rendimiento de los algoritmos de mitigación al reducir efectivamente el sesgo mientras se mantiene el rendimiento del modelo. Se eligieron conjuntos de datos disponibles públicamente de Kaggle para esta investigación, proporcionando un contexto práctico para evaluar la equidad en flujos de trabajo de aprendizaje automático del mundo real.