Données synthétiques
[[Catégorie:]]
Définition
Les données synthétiques sont un concept fondamental dans les nouvelles technologies de données qui utilisent des données non authentiques, inventées ou générées automatiquement plutôt que par des événements dans le monde réel. En comparant les données réelles et synthétiques, il est possible de mieux comprendre comment l'apprentissage automatique et d'autres nouvelles formes d'intelligence artificielle
Les données synthétiques, comme son nom l'indique, sont des données créées artificiellement plutôt que générées par des événements réels. Il est souvent créé à l'aide d'algorithmes et est utilisé pour un large éventail d'activités, notamment en tant que données de test pour de nouveaux produits et outils, pour la validation de modèles et pour les besoins de l'IA.
La façon la plus claire d'expliquer le concept de données synthétiques est que les données synthétiques ne sont pas de «vraies» données créées naturellement dans le monde réel. Les données synthétiques sont créées sans entraîner de véritables événements de données organiques. Par exemple, alors qu'un véritable ensemble d'identifiants est collecté sur un client qui utilise une plate-forme, un ingénieur pourrait finalement créer les mêmes identifiants pour un client fictif et les charger dans le système - et ce serait un exemple de données synthétiques. Une meilleure compréhension des données synthétiques est liée à la façon dont elles sont utilisées dans l'apprentissage automatique et les technologies similaires. Tout d'abord, les données synthétiques peuvent aider à donner plus de travail à un programme d'apprentissage automatique - mais la clé réside dans la façon dont ces données sont générées, car contrairement aux données réelles, les données synthétiques doivent être imaginées et inventées. Les données synthétiques peuvent également être utilisées comme un pot de miel pour déjouer les pirates. Les entreprises peuvent créer de vastes trésors de données synthétiques avec des identifiants financiers non authentiques, par exemple, et les mettre sur un système pour voir comment ils sont ciblés par des attaquants extérieurs. C'est une autre utilisation courante des données synthétiques dans les systèmes informatiques. L'utilisation de données synthétiques devrait être un problème majeur dans le développement de futurs ensembles de données de test et de formation à partir de technologies d'apprentissage automatique telles que les réseaux de neurones.
Français
données synthétiques loc. nom. fém.
données de synthèse loc. nom. fém.
Anglais
Synthetic Data
Contributeurs: Jacques Barolet, wiki