Guarde fous


(Redirigé depuis Guardrails)

Définition

Les garde-fous sont des contrôles ou des restrictions placés sur les modèles pour les empêcher de générer du contenu nuisible, illégal ou éthiquement discutable.

Dans le contexte des grands modèles de langues (GLMs), les garde-fous sont des mesures de conception proactives ou des restrictions intégrées à un modèle pour l'empêcher de générer des résultats nocifs ou indésirables. Ils se concentrent sur le contrôle et l'orientation du comportement du modèle pendant son fonctionnement.

Français

Guarde-fous

Anglais

guardrails

Sources

Grok 2 et les Garde-fous



101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »

Contributeurs: Louis Bouchard, wiki