Ataque de inyección de texto basado en funciones matemáticas en modelos de lenguaje grandes modernos
Autores: Kwon, Hyeokjin; Pak, Wooguil
Idioma: Inglés
Editor: MDPI
Año: 2024
Acceso abierto
Artículo científico
2024
Ataque de inyección de texto basado en funciones matemáticas en modelos de lenguaje grandes modernos
Categoría
Ingeniería y Tecnología
Subcategoría
Ingeniería Eléctrica y Electrónica
Palabras clave
Ataques de inyección
Mensajes de texto
Políticas de seguridad
Modelo de lenguaje
Instrucciones ilegales
Tasa de éxito
Licencia
CC BY-SA – Atribución – Compartir Igual
Consultas: 32
Citaciones: Sin citaciones
La inyección de indicaciones es un tipo de ataque que induce respuestas violentas o discriminatorias a través de la entrada de una indicación que contiene instrucciones ilegales al gran modelo de lenguaje (LLM).
Descripción
La inyección de indicaciones es un tipo de ataque que induce respuestas violentas o discriminatorias a través de la entrada de una indicación que contiene instrucciones ilegales al gran modelo de lenguaje (LLM).