Predicción de la deserción de empleados: Modelos impulsados por XAI para la toma de decisiones gerenciales
Autores: Baydili, rem Tanyldz; Tasci, Burak
Idioma: Inglés
Editor: MDPI
Año: 2025
Acceso abierto
Artículo científico
2025
Predicción de la deserción de empleados: Modelos impulsados por XAI para la toma de decisiones gerenciales
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería de Sistemas
Palabras clave
Rotación de empleados
Aprendizaje automático
IA explicable
Análisis SHAP
Modelo de transformador GAN
Conjuntos de datos de recursos humanos
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 29
Citaciones: Sin citaciones
El rotación de empleados plantea un desafío multifacético para las organizaciones al socavar la productividad, la moral y la estabilidad financiera, mientras que convierte las inversiones en reclutamiento, incorporación y capacitación en desperdicios. Los enfoques tradicionales de aprendizaje automático a menudo luchan con el desequilibrio de clases y carecen de transparencia, limitando las ideas accionables. Este estudio introduce un marco de IA Explicable (XAI) para lograr tanto una alta precisión predictiva como interpretabilidad en la previsión de rotación. Se preprocesaron dos conjuntos de datos de recursos humanos disponibles públicamente (IBM HR Analytics, Kaggle HR Analytics) con codificación de etiquetas y escalado MinMax. El desequilibrio de clases se abordó mediante la generación de datos sintéticos basada en GAN. Un codificador Transformer de tres capas realizó clasificación binaria, y el análisis de SHapley Additive exPlanations (SHAP) proporcionó atribuciones de características tanto globales como locales. El rendimiento del modelo se evaluó utilizando métricas de precisión, exactitud, recuperación, puntuación F1 y ROC AUC. En el conjunto de datos de IBM, el modelo Transformer de Red Generativa Antagónica (GAN) logró una precisión del 92.00%, una precisión del 96.67%, una recuperación del 87.00%, un F1 del 91.58% y un ROC AUC del 96.32%. En el conjunto de datos de Kaggle, alcanzó una precisión del 96.95%, una precisión del 97.28%, una recuperación del 96.60%, un F1 del 96.94% y un ROC AUC del 99.15%, superando sustancialmente los métodos de re-muestreo clásicos (ROS, SMOTE, ADASYN) y los puntos de referencia de la literatura reciente. Las explicaciones de SHAP destacaron la Satisfacción Laboral, la Edad y los Años con el Gerente Actual como los principales predictores en IBM y el número de proyectos, el nivel de satisfacción y el tiempo en la empresa en Kaggle. La conclusión es que el pipeline propuesto de GAN Transformer SHAP ofrece una predicción de rotación de última generación mientras proporciona ideas transparentes y accionables para los tomadores de decisiones de recursos humanos. El trabajo futuro debería validar la generalizabilidad en diversas industrias y desarrollar implementaciones ligeras y en tiempo real.
Descripción
El rotación de empleados plantea un desafío multifacético para las organizaciones al socavar la productividad, la moral y la estabilidad financiera, mientras que convierte las inversiones en reclutamiento, incorporación y capacitación en desperdicios. Los enfoques tradicionales de aprendizaje automático a menudo luchan con el desequilibrio de clases y carecen de transparencia, limitando las ideas accionables. Este estudio introduce un marco de IA Explicable (XAI) para lograr tanto una alta precisión predictiva como interpretabilidad en la previsión de rotación. Se preprocesaron dos conjuntos de datos de recursos humanos disponibles públicamente (IBM HR Analytics, Kaggle HR Analytics) con codificación de etiquetas y escalado MinMax. El desequilibrio de clases se abordó mediante la generación de datos sintéticos basada en GAN. Un codificador Transformer de tres capas realizó clasificación binaria, y el análisis de SHapley Additive exPlanations (SHAP) proporcionó atribuciones de características tanto globales como locales. El rendimiento del modelo se evaluó utilizando métricas de precisión, exactitud, recuperación, puntuación F1 y ROC AUC. En el conjunto de datos de IBM, el modelo Transformer de Red Generativa Antagónica (GAN) logró una precisión del 92.00%, una precisión del 96.67%, una recuperación del 87.00%, un F1 del 91.58% y un ROC AUC del 96.32%. En el conjunto de datos de Kaggle, alcanzó una precisión del 96.95%, una precisión del 97.28%, una recuperación del 96.60%, un F1 del 96.94% y un ROC AUC del 99.15%, superando sustancialmente los métodos de re-muestreo clásicos (ROS, SMOTE, ADASYN) y los puntos de referencia de la literatura reciente. Las explicaciones de SHAP destacaron la Satisfacción Laboral, la Edad y los Años con el Gerente Actual como los principales predictores en IBM y el número de proyectos, el nivel de satisfacción y el tiempo en la empresa en Kaggle. La conclusión es que el pipeline propuesto de GAN Transformer SHAP ofrece una predicción de rotación de última generación mientras proporciona ideas transparentes y accionables para los tomadores de decisiones de recursos humanos. El trabajo futuro debería validar la generalizabilidad en diversas industrias y desarrollar implementaciones ligeras y en tiempo real.