Données structurées


Définition

Les données structurées sont les données pouvant être contenues dans une base de données relationnelle et organisées de façon à pouvoir être associées à d’autres données en utilisant des tableaux.

Les données non structurées sont toutes les autres données difficiles à organiser et à structurer : courriels, billets de réseaux sociaux, textes généraux, PDF, images, discours enregistrés, sons. En général, les données non structurées exigent un prétraitement avant d’être prises en charge par un algorithme d’apprentissage.

On parle parfois de données semi-structurées pour désigner les données en format xml ou json.

Compléments

Ces deux expressions – données structurées et données non structurées – sont aujourd’hui  répandues et acceptées. C’est la première et principale façon de caractériser les données dans la société de l’information, dans les entreprises et leurs directions des systèmes d’information (DSI) mais aussi, de plus en plus, pour les responsables métiers, pour les juristes et pour les professionnels de l’information.

On parle aussi d'”informations structurées” versus “informations non structurées”

Français

Données structurées

Données non structurées

Informations structurées

Informations non structurées

Anglais

Structured Data

Unstructured Data

Sources

Source : arcateg.fr

Source : Accenture - applied intelligence glossary

Source : wifeo.com

Source : GDT - Traitement des données




101 MOTS DE L' IA
Ce terme est sélectionné pour le livre « Les 101 mots de l'intelligence artificielle »



Contributeurs: Claude Coulombe, wiki