Données structurées
Définition
Les données structurées sont les données pouvant être contenues dans une base de données relationnelle et organisées de façon à pouvoir être associées à d’autres données en utilisant des tableaux.
Les données non structurées sont toutes les autres données difficiles à organiser et à structurer : courriels, billets de réseaux sociaux, textes généraux, PDF, images, discours enregistrés, sons. En général, les données non structurées exigent un prétraitement avant d’être prises en charge par un algorithme d’apprentissage.
On parle parfois de données semi-structurées pour désigner les données en format xml ou json.
Compléments
Ces deux expressions – données structurées et données non structurées – sont aujourd’hui répandues et acceptées. C’est la première et principale façon de caractériser les données dans la société de l’information, dans les entreprises et leurs directions des systèmes d’information (DSI) mais aussi, de plus en plus, pour les responsables métiers, pour les juristes et pour les professionnels de l’information.
On parle aussi d'”informations structurées” versus “informations non structurées”
Français
Données structurées
Données non structurées
Informations structurées
Informations non structurées
Anglais
Structured Data
Unstructured Data
Sources
Source : Accenture - applied intelligence glossary
Source : GDT - Traitement des données
101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »
Contributeurs: Claude Coulombe, wiki