« Débridage en plusieurs coups » : différence entre les versions
m (Patrickdrouin a déplacé la page Débridage plusieurs coups vers Débridage en plusieurs coups) |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Méthode de [[débridage]] qui consiste à soumettre un enchaînement de plusieurs requêtes à un [[grand modèle de langues]] dans un but malveillant. | Méthode de [[débridage]] qui consiste à soumettre un enchaînement de plusieurs requêtes à un [[grand modèle de langues]] dans un but malveillant. | ||
== Français == | == Français == | ||
Ligne 25 : | Ligne 24 : | ||
[https://arxiv.org/abs/2404.01833, ''Great, Now Write an Article About That: The Crescendo Multi-Turn LLM Jailbreak Attack'', Russinovich et al. (2024)] | [https://arxiv.org/abs/2404.01833, ''Great, Now Write an Article About That: The Crescendo Multi-Turn LLM Jailbreak Attack'', Russinovich et al. (2024)] | ||
[[Catégorie: | [[Catégorie:GRAND LEXIQUE FRANÇAIS]] |
Dernière version du 8 mai 2024 à 08:33
Définition
Méthode de débridage qui consiste à soumettre un enchaînement de plusieurs requêtes à un grand modèle de langues dans un but malveillant.
Français
débridage en plusieurs coups
débridage plusieurs coups
débridage à plusieurs coups
Anglais
many-shot jailbreaking
Crescendo Multi-Turn LLM Jailbreak
Source
Many-shot jailbreaking, Anil et al. (2024)
Many-shot jailbreaking, Vlad Bogolin (2024)
Anthropic publie un nouvel article d'étude sur le "many-shot jailbreaking", Jade Emy (2024)
Contributeurs: Patrick Drouin, wiki