logo móvil
Contáctanos

Enfoques de Aprendizaje Profundo para la Extracción de Metadatos Impulsada por Big Data en Ofertas de Empleo en Línea

Autores: Skondras, Panagiotis; Zotos, Nikos; Lagios, Dimitris; Zervas, Panagiotis; Giotopoulos, Konstantinos C.; Tzimas, Giannis

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Enfoques de Aprendizaje Profundo para la Extracción de Metadatos Impulsada por Big Data en Ofertas de Empleo en Línea


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Estudio
Ofertas de trabajo
Algoritmos de aprendizaje automático
PNL
Datos sintéticos
Clasificación

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Este artículo presenta un estudio sobre la clasificación multiclase de ofertas de trabajo utilizando algoritmos de aprendizaje automático. Con el crecimiento de las plataformas de empleo en línea, ha habido un aumento en los datos del mercado laboral. El aprendizaje automático, particularmente el procesamiento del lenguaje natural (NLP), se utiliza cada vez más para analizar y clasificar ofertas de trabajo. Sin embargo, la efectividad de estos algoritmos depende en gran medida de la calidad y el volumen de los datos de entrenamiento. En nuestro estudio, proponemos una metodología de clasificación multiclase para ofertas de trabajo, basándonos en modelos de IA como text-davinci-003 y las versiones cuantizadas de Falcon 7b (Falcon), Wizardlm 7B (Wizardlm) y Vicuna 7B (Vicuna) para generar conjuntos de datos sintéticos. Estos datos sintéticos se emplean en dos escenarios de uso: (a) exclusivamente como conjuntos de datos de entrenamiento compuestos por ofertas de trabajo sintéticas (situaciones en las que no hay datos reales disponibles) y (b) como un método de aumento para reforzar categorías de títulos de trabajo subrepresentadas. Para evaluar nuestro método propuesto, nos basamos en dos enfoques bien establecidos: la red neuronal de avance (FFNN) y el modelo BERT. Tanto los casos de uso como los métodos de entrenamiento se evaluaron en comparación con un conjunto de datos genuino de ofertas de trabajo para medir la precisión de la clasificación. Nuestros experimentos confirmaron los beneficios de utilizar datos sintéticos para mejorar la clasificación de ofertas de trabajo. En el primer escenario, el rendimiento de los modelos coincidió y, en ocasiones, superó al de los datos reales. En el segundo escenario, las clases aumentadas superaron consistentemente en la mayoría de los casos. Esta investigación confirma que los conjuntos de datos generados por IA pueden mejorar la eficacia de los algoritmos de NLP, especialmente en el ámbito de la clasificación multiclase de ofertas de trabajo. Si bien el aumento de datos puede mejorar la generalización del modelo, su impacto varía. Es especialmente beneficioso para modelos más simples como FNN. BERT, debido a su arquitectura consciente del contexto, también se beneficia del aumento, pero ve una mejora limitada. Seleccionar el tipo y la cantidad adecuados de aumento es esencial.

Otros recursos que podrían interesarte

Temas Virtualpro