logo móvil
Contáctanos

Identificación de respuestas falsificadas en cuestionarios con autoencoders basados en autoatención

Autores: Purpura, Alberto; Sartori, Giuseppe; Giorgianni, Dora; Orrú, Graziella; Susto, Gian Antonio

Idioma: Inglés

Editor: MDPI

Año: 2022

Descargar PDF

Acceso abierto

Artículo científico
2022

Identificación de respuestas falsificadas en cuestionarios con autoencoders basados en autoatención


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Engaño
Simulación
Cuestionarios
Recolección de datos
Autoencoder basado en autoatención
Respuestas simuladas

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
La decepción, también conocida como falsificación, es un problema crítico al recopilar datos utilizando cuestionarios. Como muestran estudios anteriores, las personas tienden a falsificar sus respuestas siempre que obtengan una ventaja al hacerlo, por ejemplo, al presentar un examen para una solicitud de empleo. Los métodos actuales identifican la actitud general hacia la falsificación, pero no logran identificar patrones de falsificación y las respuestas exactas afectadas. Además, estas estrategias a menudo requieren una extensa recopilación de datos de respuestas honestas y patrones de falsificación relacionados con el caso de uso específico del cuestionario, por ejemplo, el puesto al que las personas están postulando. En este trabajo, proponemos un modelo de autoencoder basado en autoatención (SABA) que puede detectar respuestas falsificadas en un cuestionario basándose únicamente en un conjunto de respuestas honestas que no están necesariamente relacionadas con su caso de uso final. Recopilamos datos relativos a una prueba de personalidad popular (la prueba de los cinco grandes de 10 ítems) en tres casos de uso diferentes, es decir, para obtener: (i) la custodia de los hijos en un tribunal, (ii) un puesto como vendedor, y (iii) un rol en una organización humanitaria. El modelo propuesto supera por un margen considerable en términos de puntuación F1 a tres líneas base competitivas, es decir, un autoencoder basado solo en capas feedforward, un modelo de distribución y un modelo basado en k-vecinos más cercanos.

Otros recursos que podrían interesarte

Temas Virtualpro