« Annotation des données » : différence entre les versions


m (Claude COULOMBE a déplacé la page Annotation vers Annotation de données)
m (Remplacement de texte : « ↵↵==Sources== » par «  ==Sources== »)
 
(18 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==


L'annotation de données est une tâche essentielle dans la préparation de jeux de données d'entraînement en [[Apprentissage supervisé|apprentissage supervisé]]. La mise au point de modèles en apprentissage automatique supervisé exige le traitement d'une grande quantité de données qui doivent être annotées ou étiquetées avec précision.
L'annotation des données est une tâche essentielle dans la préparation d'un jeu de données d'entraînement en [[apprentissage supervisé]]. Chaque exemple d'un ensemble de données destiné à l'apprentissage supervisé doit comporter au moins une [[Étiquette|'''étiquette''']] dite étiquette cible qui est la réponse ou le résultat prédit par les autres attributs.  


Par exemple, en vision artificielle, l'annotation est une opération manuelle qui consiste à identifier un objet dans l'image avec une étiquette (i.e. un court texte), et/ou à encadrer un objet dans un rectangle ou un polygone irrégulier et parfois même décrire textuellement des zones spécifiques d'une image. Les cadres peuvent être en 2D (rectangles) ou même en 3D (boîtes rectangulaires ou parallépipèdes).
Par exemple, les [[Attribut|'''attributs''']] d'un jeu de données sur le logement pourraient inclure le nombre de chambres, le nombre de salles de bain et la date de construction. Dans ce cas, l'étiquette cible pourrait être le loyer mensuel du logement.
 
La mise au point de modèles en apprentissage automatique supervisé exige le traitement d'une grande quantité de données qui doivent être annotées ou étiquetées avec précision.


==Compléments==
==Compléments==
Par exemple en '''[[Vision artificielle|vision artificielle]]''', l'annotation est une opération manuelle qui consiste à identifier un objet dans l'image avec une étiquette (i.e. un court texte), et/ou à encadrer un objet dans un rectangle ou un polygone irrégulier et parfois même décrire textuellement des zones spécifiques d'une image. Les cadres peuvent être en 2D (rectangles) ou même en 3D (boîtes rectangulaires ou parallépipèdes).
<hr />
Pour annoter de grandes quantités de données, une solution est d'organiser une campagne d’annotation participative sur une plateforme de '''[[Microtravail|microtravail]]'''.
Il est également possible de sous-traiter l'annotation des données à une entreprise spécialisée.


==Français==
==Français==
'''annotation'''   
'''annotation des données'''   
 
'''annotation''' <small>(<i>moins précis</i>)</small>
 
'''étiquetage des données'''
 
'''étiquetage''' <small>(<i>moins précis</i>)</small>
 
'''enrichissement des données''' <small>(<i>plus générique</i>)</small>
 
'''enrichissement''' <small>(<i>plus générique et moins précis</i>)</small>


'''étiquetage'''  
'''balisage des données''' <small>(<i>rarement employé</i>)</small>
 
'''marquage des données''' <small>(<i>rarement employé</i>)</small>


==Anglais==
==Anglais==
'''data tagging'''
'''dataset tagging'''
'''tagging'''
'''tagging'''
'''data labeling'''
'''dataset labeling'''


'''labeling'''
'''labeling'''
'''data annotation'''
'''dataset annotation'''


'''annotation'''
'''annotation'''
==Sources==
<br>


<small>
*[https://bit.ly/3Mz1koK Source: Cours - VIARENA]


* []
*[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=data+tagging&codom2nd_wet=1#resultrecs Source: TERMIUM Plus]


</small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html>
*[https://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=2082203 Source: GDT]


===Compléments vidéos===
</small><br>
* [https://www.youtube.com/watch?v=exdULbMFCt8  L’importance et les jeux de l’annotation des données dans la réalisation d’un projet d’IA ]


<br></div><br><br>
{{Modèle:101}}


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]
[[Catégorie:101]]

Dernière version du 30 août 2024 à 13:59

Définition

L'annotation des données est une tâche essentielle dans la préparation d'un jeu de données d'entraînement en apprentissage supervisé. Chaque exemple d'un ensemble de données destiné à l'apprentissage supervisé doit comporter au moins une étiquette dite étiquette cible qui est la réponse ou le résultat prédit par les autres attributs.

Par exemple, les attributs d'un jeu de données sur le logement pourraient inclure le nombre de chambres, le nombre de salles de bain et la date de construction. Dans ce cas, l'étiquette cible pourrait être le loyer mensuel du logement.

La mise au point de modèles en apprentissage automatique supervisé exige le traitement d'une grande quantité de données qui doivent être annotées ou étiquetées avec précision.

Compléments

Par exemple en vision artificielle, l'annotation est une opération manuelle qui consiste à identifier un objet dans l'image avec une étiquette (i.e. un court texte), et/ou à encadrer un objet dans un rectangle ou un polygone irrégulier et parfois même décrire textuellement des zones spécifiques d'une image. Les cadres peuvent être en 2D (rectangles) ou même en 3D (boîtes rectangulaires ou parallépipèdes).


Pour annoter de grandes quantités de données, une solution est d'organiser une campagne d’annotation participative sur une plateforme de microtravail.

Il est également possible de sous-traiter l'annotation des données à une entreprise spécialisée.

Français

annotation des données

annotation (moins précis)

étiquetage des données

étiquetage (moins précis)

enrichissement des données (plus générique)

enrichissement (plus générique et moins précis)

balisage des données (rarement employé)

marquage des données (rarement employé)

Anglais

data tagging

dataset tagging

tagging

data labeling

dataset labeling

labeling

data annotation

dataset annotation

annotation

Sources




101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »

Contributeurs: Claude Coulombe, wiki