¿Cuál es tu género favorito, MLM? Evaluación de sesgo de género en modelos de lenguaje enmascarados multilingües

Contáctanos

Temas

Artículos

XBooks

Revistas

Laboratorios

Showroom

Infografías

Recorridos

Videos

Perfiles

Actualidad

¿Cuál es tu género favorito, MLM? Evaluación de sesgo de género en modelos de lenguaje enmascarados multilingües

Autores: Yu, Jeongrok; Kim, Seong Ug; Choi, Jacob; Choi, Jinho D.

Idioma: Inglés

Editor: MDPI

Año: 2024

Descargar PDF

Acceso abierto

Artículo científico

2024

¿Cuál es tu género favorito, MLM? Evaluación de sesgo de género en modelos de lenguaje enmascarados multilingües

Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Sesgo

Sesgo de género

Modelos de lenguaje

Enfoque multilingüe

Evaluación

Métricas de puntuación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones

El sesgo es un prejuicio desproporcionado a favor de un lado en contra de otro. Debido al éxito de los modelos de lenguaje enmascarados (MLMs) basados en transformadores y su impacto en muchas tareas de procesamiento del lenguaje natural (NLP), ahora se necesita más que nunca una evaluación sistemática del sesgo en estos modelos. Si bien muchos estudios han evaluado el sesgo de género en los MLMs en inglés, solo unos pocos han explorado el sesgo de género en otros idiomas. Este artículo propone un enfoque multilingüe para estimar el sesgo de género en los MLMs de cinco idiomas: chino, inglés, alemán, portugués y español. A diferencia de trabajos anteriores, nuestro enfoque no depende de corpora paralelos acoplados con inglés para detectar el sesgo de género en otros idiomas utilizando léxicos multilingües. Además, se presenta un nuevo método basado en modelos para generar pares de oraciones para un análisis más robusto del sesgo de género. Para cada idioma, se aplican métodos basados en léxicos y en modelos para crear dos conjuntos de datos, que se utilizan para evaluar el sesgo de género en un MLM específicamente entrenado para ese idioma utilizando una métrica de puntuación existente y tres nuevas. Nuestros resultados muestran que el enfoque anterior es sensible a los datos e inestable, lo que sugiere que el sesgo de género debe evaluarse en un conjunto de datos grande utilizando múltiples métricas de evaluación para mejores prácticas.

Descripción

Otros recursos que podrían interesarte

Ver todas

Temas Virtualpro

Ver todas

Categoría

Subcategoría

Palabras clave

Licencia

Citación bibliográfica

Formato

¡Regístrate ahora y conoce todos los espacios virtuales disponibles para tu institución!

Otros recursos que podrían interesarte

Temas Virtualpro