Diferenciando chat generativo preentrenado transformer de humanos: detectando texto generado por ChatGPT y texto humano usando aprendizaje automático
Autores: Katib, Iyad; Assiri, Fatmah Y.; Abdushkour, Hesham A.; Hamed, Diaa; Ragab, Mahmoud
Idioma: Inglés
Editor: MDPI
Año: 2023
Acceso abierto
Artículo científico
2023
Diferenciando chat generativo preentrenado transformer de humanos: detectando texto generado por ChatGPT y texto humano usando aprendizaje automático
Categoría
Matemáticas
Subcategoría
Matemáticas generales
Palabras clave
Identificación
Texto
Generado por ChatGPT
TSA-LSTMRNN
Detección
Rendimiento
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 47
Citaciones: Sin citaciones
Recientemente, la identificación de texto humano y texto generado por ChatGPT se ha convertido en un tema de investigación candente. El estudio actual presenta un modelo de Algoritmo de Enjambre de Tunicados con Red Neuronal Recurrente de Memoria a Corto y Largo Plazo (TSA-LSTMRNN) para detectar tanto texto humano como texto generado por ChatGPT. El propósito del método propuesto TSA-LSTMRNN es investigar la decisión del modelo y detectar la presencia de algún patrón particular. Además de esto, la técnica TSA-LSTMRNN se centra en diseñar Frecuencia de Término-Inversa de Frecuencia de Documento (TF-IDF), incrustación de palabras y vectorizadores de conteo para el proceso de extracción de características. Para los procesos de detección y clasificación, se utiliza el modelo LSTMRNN. Finalmente, el TSA se emplea para seleccionar los parámetros para el enfoque LSTMRNN, lo que permite mejorar el rendimiento de detección. El rendimiento de simulación de la técnica TSA-LSTMRNN propuesta se investigó en bases de datos de referencia, y el resultado demostró la ventaja del sistema TSA-LSTMRNN sobre otros métodos recientes con una precisión máxima del 93.17% y 93.83% en conjuntos de datos generados por humanos y ChatGPT, respectivamente.
Descripción
Recientemente, la identificación de texto humano y texto generado por ChatGPT se ha convertido en un tema de investigación candente. El estudio actual presenta un modelo de Algoritmo de Enjambre de Tunicados con Red Neuronal Recurrente de Memoria a Corto y Largo Plazo (TSA-LSTMRNN) para detectar tanto texto humano como texto generado por ChatGPT. El propósito del método propuesto TSA-LSTMRNN es investigar la decisión del modelo y detectar la presencia de algún patrón particular. Además de esto, la técnica TSA-LSTMRNN se centra en diseñar Frecuencia de Término-Inversa de Frecuencia de Documento (TF-IDF), incrustación de palabras y vectorizadores de conteo para el proceso de extracción de características. Para los procesos de detección y clasificación, se utiliza el modelo LSTMRNN. Finalmente, el TSA se emplea para seleccionar los parámetros para el enfoque LSTMRNN, lo que permite mejorar el rendimiento de detección. El rendimiento de simulación de la técnica TSA-LSTMRNN propuesta se investigó en bases de datos de referencia, y el resultado demostró la ventaja del sistema TSA-LSTMRNN sobre otros métodos recientes con una precisión máxima del 93.17% y 93.83% en conjuntos de datos generados por humanos y ChatGPT, respectivamente.