« Augmentation des données » : différence entre les versions


m (Remplacement de texte — « Termes privilégiés » par « Français »)
m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(33 versions intermédiaires par 4 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
__NOTOC__
==Définition==
Processus d’augmentation de la quantité de données d'entraînement par la création de nouvelles données à partir des données existantes.


== Domaine ==
==Compléments==
[[Category:Vocabulary]]Vocabulary<br />
On préférera parfois le terme amplification de données, puisque l’on crée de nouvelles données en préservant la classe-cible, la sémantique de la donnée demeurant invariante.
[[Category:Apprentissage automatique]]  Apprentissage automatique<br />
[[Category:Apprentissage profond]]  Apprentissage profond<br />
[[Category:Science des données]]  Science des données<br />


<br />
Sur le plan terminologique on utilise les termes: amplification des données, données amplifiées, augmentation des données, données augmentées, synthèse de données, données synthétiques, données artificielles, génération de données, données générées, données simulées, et même parfois fausses données (fake data).


== Définition ==
==Français==
Afin d'améliorer les performances d'un algorithme d'apprentissage automatique, on cherchera à augmenter la quantité de données d'entraînement. Techniquement cela s'apparente à de la régularisation.
'''augmentation des données''
<br />
== Français ==
<h3><poll>
Choisissez parmi ces termes proposés :
amplification de données
augmentation de données
</poll></h3>


<h4>Discussion:</h4>
'''amplification des données'''
Dans le cas où les données sont générées (synthétisées) à partir de sources externes, comme des bases de données externes, on sera justifié de parler d'augmentation de données. Par contre, lorsque les nouvelles données résultent de simples transformations des données existantes, il serait plus juste de désigner le processus comme de l'amplification de données. 


Note: À voir avec un linguiste: amplification de données ou amplification des données.
'''synthèse des données''' 
<br />


== Anglais ==
==Anglais==
'''data augmentation'''


=== Data Augmentation ===
'''data amplification'''
To improve the machine learning algorithms performance, we could try to increase the number of data samples or observations.


<br/>
'''data synthesis'''
<br/>
==Sources==
<br/>
 
<br/>
[http://dic.uqam.ca/upload/files/Sei%CC%80minaire%20DIC-CREA%20-%2024jan19%20-%20Amplification%20des%20donnei%CC%80es%20textuelles%20pour%20l%E2%80%99apprentissage%20profond.pdf, Source: Claude Coulombe]
<br/>
 
<br/>
[https://cloud.google.com/training/courses/advanced-machine-learning-gcp?hl=fr, Source: ''Advanced Machine Learning with TensorFlow on Google Cloud Platform'', consulté le 10 juin 2019]
<br/>
 
[[Utilisateur:Patrickdrouin  | Source: Termino]]
 
[[Catégorie: Termino 2019]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 30 août 2024 à 13:55

Définition

Processus d’augmentation de la quantité de données d'entraînement par la création de nouvelles données à partir des données existantes.

Compléments

On préférera parfois le terme amplification de données, puisque l’on crée de nouvelles données en préservant la classe-cible, la sémantique de la donnée demeurant invariante.

Sur le plan terminologique on utilise les termes: amplification des données, données amplifiées, augmentation des données, données augmentées, synthèse de données, données synthétiques, données artificielles, génération de données, données générées, données simulées, et même parfois fausses données (fake data).

Français

augmentation des données

amplification des données

synthèse des données

Anglais

data augmentation

data amplification

data synthesis

Sources

Source: Claude Coulombe

Source: Advanced Machine Learning with TensorFlow on Google Cloud Platform, consulté le 10 juin 2019

Source: Termino