« Attaque adverse » : différence entre les versions
(Page créée avec « ==Définition== Les attaques par entrées malicieuses visent à soumettre des données sournoises ou corrompues à système d'IA en phase de production. == Compléments == Les attaques par entées malicieuses concernent autant les images, les textes ou la voix. Par exemple, on peut vouloir déjouer un système de reconnaissance faciale, On pourrait maquiller un arrêt obligatoire pour qu'il ne soit pas reconnu par un système de vision d'une voiture auto... ») |
(Aucune différence)
|
Version du 19 mars 2024 à 14:56
Définition
Les attaques par entrées malicieuses visent à soumettre des données sournoises ou corrompues à système d'IA en phase de production.
Compléments
Les attaques par entées malicieuses concernent autant les images, les textes ou la voix.
Par exemple, on peut vouloir déjouer un système de reconnaissance faciale,
On pourrait maquiller un arrêt obligatoire pour qu'il ne soit pas reconnu par un système de vision d'une voiture autonome.
Faire fabuler un grand modèle de langues pour qu'il révèle des informations autrement non accessibles.
Gagner l'accès à un système protégé par une système de reconnaissance vocale.
Français
attaque par entrées malicieuses
attaque par exemples contradictoires
Anglais
adversarial attack
Sources
Attaques Adverses de l’Apprentissage Profond : Fonctionnement et Menace, Maina et Moumen 2021
On the impact of randomization on robustness in machine learning, Piot 2020
Contributeurs: Patrick Drouin, wiki