¿Quién es el responsable del sesgo en las visualizaciones, ChatGPT o DALL-E?
Autores: Spennemann, Dirk H. R.
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
¿Quién es el responsable del sesgo en las visualizaciones, ChatGPT o DALL-E?
Categoría
Ingeniería y Tecnología
Subcategoría
Inteligencia Artificial
Palabras clave
Una variedad de factores
Inteligencia artificial generativa
Sesgo
Datos de entrenamiento
Modelos de lenguaje grandes
Programas de visualización
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 80
Citaciones: Sin citaciones
Debido a una serie de factores en la etapa de desarrollo, los modelos de inteligencia artificial generativa (IA) no pueden estar completamente libres de sesgos. Algunos sesgos son introducidos por la calidad de los datos de entrenamiento y la influencia de los desarrolladores durante el diseño y entrenamiento de los grandes modelos de lenguaje (LLMs), mientras que otros son introducidos en los programas de visualización de texto a imagen (T2I). El sesgo y la inicialización en la interfaz entre LLMs y aplicaciones T2I no han sido examinados hasta la fecha. Este estudio analiza 770 imágenes de bibliotecarios y conservadores generadas por DALL-E a partir de indicaciones de ChatGPT-4o para investigar la fuente de los sesgos de género, etnia y edad en estas visualizaciones. Al comparar las indicaciones generadas por ChatGPT-4o con las interpretaciones visuales de DALL-E, la investigación demuestra que DALL-E introduce principalmente sesgos cuando ChatGPT-4o proporciona indicaciones no específicas. Esto destaca el potencial de la IA generativa para perpetuar y amplificar estereotipos dañinos relacionados con género, edad y etnia en roles profesionales.
Descripción
Debido a una serie de factores en la etapa de desarrollo, los modelos de inteligencia artificial generativa (IA) no pueden estar completamente libres de sesgos. Algunos sesgos son introducidos por la calidad de los datos de entrenamiento y la influencia de los desarrolladores durante el diseño y entrenamiento de los grandes modelos de lenguaje (LLMs), mientras que otros son introducidos en los programas de visualización de texto a imagen (T2I). El sesgo y la inicialización en la interfaz entre LLMs y aplicaciones T2I no han sido examinados hasta la fecha. Este estudio analiza 770 imágenes de bibliotecarios y conservadores generadas por DALL-E a partir de indicaciones de ChatGPT-4o para investigar la fuente de los sesgos de género, etnia y edad en estas visualizaciones. Al comparar las indicaciones generadas por ChatGPT-4o con las interpretaciones visuales de DALL-E, la investigación demuestra que DALL-E introduce principalmente sesgos cuando ChatGPT-4o proporciona indicaciones no específicas. Esto destaca el potencial de la IA generativa para perpetuar y amplificar estereotipos dañinos relacionados con género, edad y etnia en roles profesionales.