Predicción de Personalidad MBTI Usando Aprendizaje Automático y SMOTE para Balancear Datos Basados en Frases de Declaración
Autores: Ryan, Gregorius; Katarina, Pricillia; Suhartono, Derwin
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Predicción de Personalidad MBTI Usando Aprendizaje Automático y SMOTE para Balancear Datos Basados en Frases de Declaración
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Redes sociales
Indicador de Tipo Myers-Briggs
Técnicas de incrustación de palabras
Algoritmos de aprendizaje automático
Técnicas de manejo de datos desbalanceados
Personalidad MBTI
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
El auge de las redes sociales como plataforma para la autoexpresión y la autocomprensión ha llevado a un mayor interés en el uso del Indicador de Tipo de Myers-Briggs (MBTI) para explorar las personalidades humanas. A pesar de esto, se necesita más investigación sobre cómo otras técnicas de incrustación de palabras, algoritmos de aprendizaje automático y técnicas de manejo de datos desbalanceados pueden mejorar los resultados de las predicciones de tipos de personalidad del MBTI. Nuestra investigación tuvo como objetivo investigar la eficacia de estas técnicas utilizando el modelo Word2Vec para obtener una representación vectorial de las palabras en los datos del corpus. Implementamos varios enfoques de aprendizaje automático, incluyendo regresión logística, clasificación de vectores de soporte lineales, descenso de gradiente estocástico, bosque aleatorio, el clasificador de aumento de gradiente extremo y el clasificador de aumento de gato. Además, utilizamos la técnica de sobremuestreo de minorías sintéticas (SMOTE) para abordar el problema de los datos desbalanceados. Los resultados mostraron que nuestro enfoque podría lograr una puntuación F1 relativamente alta (entre 0.7383 y 0.8282), dependiendo del modelo elegido para predecir y clasificar la personalidad del MBTI. Además, encontramos que el uso de SMOTE podría mejorar el rendimiento de los modelos seleccionados (puntuación F1 entre 0.7553 y 0.8337), demostrando que el enfoque de aprendizaje automático integrado con Word2Vec y SMOTE podría predecir y clasificar bien la personalidad del MBTI, mejorando así la comprensión del MBTI.
Descripción
El auge de las redes sociales como plataforma para la autoexpresión y la autocomprensión ha llevado a un mayor interés en el uso del Indicador de Tipo de Myers-Briggs (MBTI) para explorar las personalidades humanas. A pesar de esto, se necesita más investigación sobre cómo otras técnicas de incrustación de palabras, algoritmos de aprendizaje automático y técnicas de manejo de datos desbalanceados pueden mejorar los resultados de las predicciones de tipos de personalidad del MBTI. Nuestra investigación tuvo como objetivo investigar la eficacia de estas técnicas utilizando el modelo Word2Vec para obtener una representación vectorial de las palabras en los datos del corpus. Implementamos varios enfoques de aprendizaje automático, incluyendo regresión logística, clasificación de vectores de soporte lineales, descenso de gradiente estocástico, bosque aleatorio, el clasificador de aumento de gradiente extremo y el clasificador de aumento de gato. Además, utilizamos la técnica de sobremuestreo de minorías sintéticas (SMOTE) para abordar el problema de los datos desbalanceados. Los resultados mostraron que nuestro enfoque podría lograr una puntuación F1 relativamente alta (entre 0.7383 y 0.8282), dependiendo del modelo elegido para predecir y clasificar la personalidad del MBTI. Además, encontramos que el uso de SMOTE podría mejorar el rendimiento de los modelos seleccionados (puntuación F1 entre 0.7553 y 0.8337), demostrando que el enfoque de aprendizaje automático integrado con Word2Vec y SMOTE podría predecir y clasificar bien la personalidad del MBTI, mejorando así la comprensión del MBTI.