Método Colaborativo de Múltiples Agentes para la Detección de Texto Generado por LLM en Zero-Shot
Autores: Sun, Gang; Li, Bowen; Zhou, Ying; Zhu, Yi; Qiang, Jipeng
Idioma: Inglés
Editor: MDPI
Año: 2026
Acceso abierto
Artículo científico
2026
Método Colaborativo de Múltiples Agentes para la Detección de Texto Generado por LLM en Zero-Shot
Categoría
Gestión y administración
Subcategoría
Gestión de la tecnología y la inovación
Palabras clave
Modelos de lenguaje grandes
Texto generado por máquinas
Autenticidad del contenido
Integridad académica
Confianza
Marco de detección
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 1
Citaciones: Sin citaciones
Con la rápida proliferación de modelos de lenguaje grandes (LLMs), distinguir el texto generado por máquinas del contenido escrito por humanos se ha vuelto cada vez más crítico para garantizar la autenticidad del contenido, la integridad académica y la confianza en los sistemas de información. Sin embargo, detectar texto generado por LLMs sigue siendo un problema desafiante, particularmente en configuraciones de cero disparos donde no hay datos etiquetados y la afinación específica del dominio no está disponible. Para abordar este desafío, en este artículo, proponemos un nuevo marco de Detección Colaborativa Multi-Agente de Cero Disparos (CMA-ZSD). A diferencia de los métodos existentes basados en marcas de agua, heurísticas estadísticas o clasificadores neuronales, nuestro CMA-ZSD emplea tres agentes funcionalmente heterogéneos que realizan perturbaciones diferenciadas del texto de entrada. Al modelar conjuntamente la consistencia semántica, la normalización gramatical y la reconstrucción a nivel de características, nuestro método captura asimetrías intrínsecas entre el texto escrito por humanos y el generado por LLM. Un mecanismo de evaluación de similitud semántica, combinado con votación mayoritaria, permite decisiones de detección robustas e interpretables que equilibran la autonomía individual de los agentes con el consenso colectivo. Experimentos extensivos en 11 dominios demuestran la efectividad de nuestro método, con su detección de cero disparos logrando una precisión comparable a modelos afinados para dominios específicos como Finanzas y Reddit-dli5.
Descripción
Con la rápida proliferación de modelos de lenguaje grandes (LLMs), distinguir el texto generado por máquinas del contenido escrito por humanos se ha vuelto cada vez más crítico para garantizar la autenticidad del contenido, la integridad académica y la confianza en los sistemas de información. Sin embargo, detectar texto generado por LLMs sigue siendo un problema desafiante, particularmente en configuraciones de cero disparos donde no hay datos etiquetados y la afinación específica del dominio no está disponible. Para abordar este desafío, en este artículo, proponemos un nuevo marco de Detección Colaborativa Multi-Agente de Cero Disparos (CMA-ZSD). A diferencia de los métodos existentes basados en marcas de agua, heurísticas estadísticas o clasificadores neuronales, nuestro CMA-ZSD emplea tres agentes funcionalmente heterogéneos que realizan perturbaciones diferenciadas del texto de entrada. Al modelar conjuntamente la consistencia semántica, la normalización gramatical y la reconstrucción a nivel de características, nuestro método captura asimetrías intrínsecas entre el texto escrito por humanos y el generado por LLM. Un mecanismo de evaluación de similitud semántica, combinado con votación mayoritaria, permite decisiones de detección robustas e interpretables que equilibran la autonomía individual de los agentes con el consenso colectivo. Experimentos extensivos en 11 dominios demuestran la efectividad de nuestro método, con su detección de cero disparos logrando una precisión comparable a modelos afinados para dominios específicos como Finanzas y Reddit-dli5.