logo móvil
Contáctanos

Un Conjunto de Datos de Referencia para Distinguir Artículos Científicos Escritos por Humanos y Generados por Máquinas

Autores: Abdalla, Mohamed Hesham Ibrahim; Malberg, Simon; Dementieva, Daryna; Mosca, Edoardo; Groh, Georg

Idioma: Inglés

Editor: MDPI

Año: 2023

Descargar PDF

Acceso abierto

Artículo científico
2023

Un Conjunto de Datos de Referencia para Distinguir Artículos Científicos Escritos por Humanos y Generados por Máquinas


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Nlp generativo
Texto generado por máquina
Conjunto de datos de referencia
Artículos científicos
Detección de autoría
Capacidades de generalización

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
A medida que la NLP generativa puede producir contenido casi indistinguible de la escritura humana, se está volviendo difícil identificar contribuciones de investigación genuinas en la escritura académica y las publicaciones científicas. Además, la información en el texto generado por máquinas puede ser factualmente incorrecta o incluso completamente fabricada. En este trabajo, introducimos un nuevo conjunto de datos de referencia que contiene artículos científicos escritos por humanos y generados por máquinas de SCIgen, GPT-2, GPT-3, ChatGPT y Galactica, así como artículos co-creados por humanos y ChatGPT. También experimentamos con varios tipos de clasificadores, basados en lingüística y en transformadores, para detectar la autoría del texto científico. Se pone un fuerte énfasis en las capacidades de generalización y la explicabilidad para resaltar las fortalezas y debilidades de estos detectores. Nuestro trabajo representa un paso importante hacia la creación de métodos más robustos para distinguir entre artículos científicos escritos por humanos y generados por máquinas, asegurando en última instancia la integridad de la literatura científica.

Otros recursos que podrían interesarte

Temas Virtualpro