logo móvil
Contáctanos

Método Colaborativo de Múltiples Agentes para la Detección de Texto Generado por LLM en Zero-Shot

Autores: Sun, Gang; Li, Bowen; Zhou, Ying; Zhu, Yi; Qiang, Jipeng

Idioma: Inglés

Editor: MDPI

Año: 2026

Descargar PDF

Acceso abierto

Artículo científico
2026

Método Colaborativo de Múltiples Agentes para la Detección de Texto Generado por LLM en Zero-Shot


Categoría

Gestión y administración

Subcategoría

Gestión de la tecnología y la inovación

Palabras clave

Modelos de lenguaje grandes
Texto generado por máquinas
Autenticidad del contenido
Integridad académica
Confianza
Marco de detección

Licencia

CC BY-SA – Atribución – Compartir Igual

Consultas: 1

Citaciones: Sin citaciones


Descripción
Con la rápida proliferación de modelos de lenguaje grandes (LLMs), distinguir el texto generado por máquinas del contenido escrito por humanos se ha vuelto cada vez más crítico para garantizar la autenticidad del contenido, la integridad académica y la confianza en los sistemas de información. Sin embargo, detectar texto generado por LLMs sigue siendo un problema desafiante, particularmente en configuraciones de cero disparos donde no hay datos etiquetados y la afinación específica del dominio no está disponible. Para abordar este desafío, en este artículo, proponemos un nuevo marco de Detección Colaborativa Multi-Agente de Cero Disparos (CMA-ZSD). A diferencia de los métodos existentes basados en marcas de agua, heurísticas estadísticas o clasificadores neuronales, nuestro CMA-ZSD emplea tres agentes funcionalmente heterogéneos que realizan perturbaciones diferenciadas del texto de entrada. Al modelar conjuntamente la consistencia semántica, la normalización gramatical y la reconstrucción a nivel de características, nuestro método captura asimetrías intrínsecas entre el texto escrito por humanos y el generado por LLM. Un mecanismo de evaluación de similitud semántica, combinado con votación mayoritaria, permite decisiones de detección robustas e interpretables que equilibran la autonomía individual de los agentes con el consenso colectivo. Experimentos extensivos en 11 dominios demuestran la efectividad de nuestro método, con su detección de cero disparos logrando una precisión comparable a modelos afinados para dominios específicos como Finanzas y Reddit-dli5.

Otros recursos que podrían interesarte

Temas Virtualpro