« Débridage » : différence entre les versions


(Page créée avec « == Définition == Action qui consiste à contourner les restrictions d'utilisation de différents systèmes informatiques (matériels ou logiciels) dont des grands modèles de langues. == Compléments == L'action correspondante se nomme ''débridage'' et s'effectue, pour un grand modèle de langues, à l'aide d'une ou de plusieurs requêtes astucieusement rédigées. == Français == '''débrider''' '''débridage'... »)
 
Aucun résumé des modifications
 
(5 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 6 : Ligne 6 :


== Français ==
== Français ==
'''débridage'''
'''débrider'''
'''débrider'''


'''débridage'''


== Anglais ==
== Anglais ==
Ligne 20 : Ligne 21 :


[https://vitrinelinguistique.oqlf.gouv.qc.ca/fiche-gdt/fiche/26506459/debrider  Source : Vitrine linguistique ]
[https://vitrinelinguistique.oqlf.gouv.qc.ca/fiche-gdt/fiche/26506459/debrider  Source : Vitrine linguistique ]
[https://www.darkreading.com/cyber-risk/researchers-show-how-to-use-one-llm-to-jailbreak-another ''Researchers Use AI to Jailbreak ChatGPT, Other LLMs''  Source: Darkreading]
[https://openreview.net/forum?id=1zt8GWZ9sc ''Quack: Automatic Jailbreaking Large Language Models via Role-playing'' Source : Jin et al. 2023]




[[Catégorie:Publication]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 19 mars 2024 à 22:10

Définition

Action qui consiste à contourner les restrictions d'utilisation de différents systèmes informatiques (matériels ou logiciels) dont des grands modèles de langues.

Compléments

L'action correspondante se nomme débridage et s'effectue, pour un grand modèle de langues, à l'aide d'une ou de plusieurs requêtes astucieusement rédigées.

Français

débridage

débrider


Anglais

jailbreak

jailbreaking


Sources

Source : TERMIUM Plus

Source : Vitrine linguistique

Researchers Use AI to Jailbreak ChatGPT, Other LLMs Source: Darkreading

Quack: Automatic Jailbreaking Large Language Models via Role-playing Source : Jin et al. 2023



Contributeurs: Patrick Drouin, wiki