« Annotation des données » : différence entre les versions


Aucun résumé des modifications
m (Remplacement de texte : « ↵↵↵ » par «   »)
 
(12 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
==Définition==
==Définition==


L'annotation des données est une tâche essentielle dans la préparation d'un jeu de données d'entraînement en [[Apprentissage supervisé|apprentissage supervisé]]. Chaque exemple d'un ensemble de données destiné à l'apprentissage supervisé doit comporter au moins une '''[[Étiquette|étiquette]]''' dite étiquette-cible qui est la réponse ou le résultat prédit par les autres attributs.  
L'annotation des données est une tâche essentielle dans la préparation d'un jeu de données d'entraînement en [[apprentissage supervisé]]. Chaque exemple d'un ensemble de données destiné à l'apprentissage supervisé doit comporter au moins une [[Étiquette|'''étiquette''']] dite étiquette cible qui est la réponse ou le résultat prédit par les autres attributs.  


Par exemple, les '''[attribut|attributs]''' d'un jeu de données sur le logement pourraient inclure le nombre de chambres, le nombre de salles de bain et la date de construction. L'étiquette-cible pourrait être le loyer mensuel du logement.  
Par exemple, les [[Attribut|'''attributs''']] d'un jeu de données sur le logement pourraient inclure le nombre de chambres, le nombre de salles de bain et la date de construction. Dans ce cas, l'étiquette cible pourrait être le loyer mensuel du logement.


La mise au point de modèles en apprentissage automatique supervisé exige le traitement d'une grande quantité de données qui doivent être annotées ou étiquetées avec précision.
La mise au point de modèles en apprentissage automatique supervisé exige le traitement d'une grande quantité de données qui doivent être annotées ou étiquetées avec précision.


==Compléments==
==Compléments==
Par exemple en vision artificielle, l'annotation est une opération manuelle qui consiste à identifier un objet dans l'image avec une étiquette (i.e. un court texte), et/ou à encadrer un objet dans un rectangle ou un polygone irrégulier et parfois même décrire textuellement des zones spécifiques d'une image. Les cadres peuvent être en 2D (rectangles) ou même en 3D (boîtes rectangulaires ou parallépipèdes).
Par exemple en '''[[Vision artificielle|vision artificielle]]''', l'annotation est une opération manuelle qui consiste à identifier un objet dans l'image avec une étiquette (i.e. un court texte), et/ou à encadrer un objet dans un rectangle ou un polygone irrégulier et parfois même décrire textuellement des zones spécifiques d'une image. Les cadres peuvent être en 2D (rectangles) ou même en 3D (boîtes rectangulaires ou parallépipèdes).
<hr />
Pour annoter de grandes quantités de données, une solution est d'organiser une campagne d’annotation participative sur une plateforme de '''[[Microtravail|microtravail]]'''.
 
Il est également possible de sous-traiter l'annotation des données à une entreprise spécialisée.


==Français==
==Français==
Ligne 46 : Ligne 50 :
'''annotation'''
'''annotation'''


<small>
==Sources==


* [https://bit.ly/3Mz1koK Source: Cours - VIARENA]
<br>


* [https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=data+tagging&codom2nd_wet=1#resultrecs Source: TERMIUM Plus]
*[https://bit.ly/3Mz1koK Source: Cours - VIARENA]


* [https://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=2082203 Source: GDT]
*[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&i=1&srchtxt=data+tagging&codom2nd_wet=1#resultrecs Source: TERMIUM Plus]


</small><br> <div style="border:2px solid #336699; background: #f6f6f6; padding: 1em; margin-bottom:1em; width: 90%;"><html><a href="https://datafranca.org/wiki/Cat%C3%A9gorie:101"><img src="https://datafranca.org/images/icone-101-mots.png" width="250"></a></html>
*[https://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=2082203 Source: GDT]


===Compléments vidéos===
</small><br>
* [https://www.youtube.com/watch?v=exdULbMFCt8  L’importance et les jeux de l’annotation des données dans la réalisation d’un projet d’IA ]


<br></div><br><br>
{{Modèle:101}}


[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]
[[Catégorie:101]]
[[Catégorie:101]]
[[Catégorie:PUBLICATION]]

Dernière version du 29 janvier 2024 à 11:27

Définition

L'annotation des données est une tâche essentielle dans la préparation d'un jeu de données d'entraînement en apprentissage supervisé. Chaque exemple d'un ensemble de données destiné à l'apprentissage supervisé doit comporter au moins une étiquette dite étiquette cible qui est la réponse ou le résultat prédit par les autres attributs.

Par exemple, les attributs d'un jeu de données sur le logement pourraient inclure le nombre de chambres, le nombre de salles de bain et la date de construction. Dans ce cas, l'étiquette cible pourrait être le loyer mensuel du logement.

La mise au point de modèles en apprentissage automatique supervisé exige le traitement d'une grande quantité de données qui doivent être annotées ou étiquetées avec précision.

Compléments

Par exemple en vision artificielle, l'annotation est une opération manuelle qui consiste à identifier un objet dans l'image avec une étiquette (i.e. un court texte), et/ou à encadrer un objet dans un rectangle ou un polygone irrégulier et parfois même décrire textuellement des zones spécifiques d'une image. Les cadres peuvent être en 2D (rectangles) ou même en 3D (boîtes rectangulaires ou parallépipèdes).


Pour annoter de grandes quantités de données, une solution est d'organiser une campagne d’annotation participative sur une plateforme de microtravail.

Il est également possible de sous-traiter l'annotation des données à une entreprise spécialisée.

Français

annotation des données

annotation (moins précis)

étiquetage des données

étiquetage (moins précis)

enrichissement des données (plus générique)

enrichissement (plus générique et moins précis)

balisage des données (rarement employé)

marquage des données (rarement employé)

Anglais

data tagging

dataset tagging

tagging

data labeling

dataset labeling

labeling

data annotation

dataset annotation

annotation

Sources




101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »



Contributeurs: Claude Coulombe, wiki