Identificación de respuestas falsificadas en cuestionarios con autoencoders basados en autoatención
Autores: Purpura, Alberto; Sartori, Giuseppe; Giorgianni, Dora; Orrú, Graziella; Susto, Gian Antonio
Idioma: Inglés
Editor: MDPI
Año: 2022
Acceso abierto
Artículo científico
2022
Identificación de respuestas falsificadas en cuestionarios con autoencoders basados en autoatención
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Engaño
Simulación
Cuestionarios
Recolección de datos
Autoencoder basado en autoatención
Respuestas simuladas
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
La decepción, también conocida como falsificación, es un problema crítico al recopilar datos utilizando cuestionarios. Como muestran estudios anteriores, las personas tienden a falsificar sus respuestas siempre que obtengan una ventaja al hacerlo, por ejemplo, al presentar un examen para una solicitud de empleo. Los métodos actuales identifican la actitud general hacia la falsificación, pero no logran identificar patrones de falsificación y las respuestas exactas afectadas. Además, estas estrategias a menudo requieren una extensa recopilación de datos de respuestas honestas y patrones de falsificación relacionados con el caso de uso específico del cuestionario, por ejemplo, el puesto al que las personas están postulando. En este trabajo, proponemos un modelo de autoencoder basado en autoatención (SABA) que puede detectar respuestas falsificadas en un cuestionario basándose únicamente en un conjunto de respuestas honestas que no están necesariamente relacionadas con su caso de uso final. Recopilamos datos relativos a una prueba de personalidad popular (la prueba de los cinco grandes de 10 ítems) en tres casos de uso diferentes, es decir, para obtener: (i) la custodia de los hijos en un tribunal, (ii) un puesto como vendedor, y (iii) un rol en una organización humanitaria. El modelo propuesto supera por un margen considerable en términos de puntuación F1 a tres líneas base competitivas, es decir, un autoencoder basado solo en capas feedforward, un modelo de distribución y un modelo basado en k-vecinos más cercanos.
Descripción
La decepción, también conocida como falsificación, es un problema crítico al recopilar datos utilizando cuestionarios. Como muestran estudios anteriores, las personas tienden a falsificar sus respuestas siempre que obtengan una ventaja al hacerlo, por ejemplo, al presentar un examen para una solicitud de empleo. Los métodos actuales identifican la actitud general hacia la falsificación, pero no logran identificar patrones de falsificación y las respuestas exactas afectadas. Además, estas estrategias a menudo requieren una extensa recopilación de datos de respuestas honestas y patrones de falsificación relacionados con el caso de uso específico del cuestionario, por ejemplo, el puesto al que las personas están postulando. En este trabajo, proponemos un modelo de autoencoder basado en autoatención (SABA) que puede detectar respuestas falsificadas en un cuestionario basándose únicamente en un conjunto de respuestas honestas que no están necesariamente relacionadas con su caso de uso final. Recopilamos datos relativos a una prueba de personalidad popular (la prueba de los cinco grandes de 10 ítems) en tres casos de uso diferentes, es decir, para obtener: (i) la custodia de los hijos en un tribunal, (ii) un puesto como vendedor, y (iii) un rol en una organización humanitaria. El modelo propuesto supera por un margen considerable en términos de puntuación F1 a tres líneas base competitivas, es decir, un autoencoder basado solo en capas feedforward, un modelo de distribución y un modelo basado en k-vecinos más cercanos.