« Données structurées » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 3 : | Ligne 3 : | ||
Les données structurées sont les données pouvant être contenues dans une base de données relationnelle et organisées de façon à pouvoir être associées à d’autres données en utilisant des tableaux. | Les données structurées sont les données pouvant être contenues dans une base de données relationnelle et organisées de façon à pouvoir être associées à d’autres données en utilisant des tableaux. | ||
Les données non structurées sont toutes les autres données difficiles à organiser et à structurer : courriels, billets de réseaux sociaux, textes généraux, PDF, images, .png, jpg, discours enregistrés, sons, vidéos, mpeg. | Les données non structurées sont toutes les autres données difficiles à organiser et à structurer : courriels, billets de réseaux sociaux, textes généraux, PDF, images, .png, jpg, discours enregistrés, sons, mp3, wave, ogg, vidéos, mpeg, mp4, mov. En général, les données non structurées exigent un prétraitement avant d’être prises en charge par un algorithme d’apprentissage. | ||
On parle parfois de données semi-structurées pour désigner les données en format xml ou json. | On parle parfois de données semi-structurées pour désigner les données en format xml ou json. | ||
Ligne 26 : | Ligne 26 : | ||
'''Unstructured Data''' | '''Unstructured Data''' | ||
<small> | <small> |
Version du 6 août 2022 à 19:26
Définition
Les données structurées sont les données pouvant être contenues dans une base de données relationnelle et organisées de façon à pouvoir être associées à d’autres données en utilisant des tableaux.
Les données non structurées sont toutes les autres données difficiles à organiser et à structurer : courriels, billets de réseaux sociaux, textes généraux, PDF, images, .png, jpg, discours enregistrés, sons, mp3, wave, ogg, vidéos, mpeg, mp4, mov. En général, les données non structurées exigent un prétraitement avant d’être prises en charge par un algorithme d’apprentissage.
On parle parfois de données semi-structurées pour désigner les données en format xml ou json.
Compléments
Ces deux expressions – données structurées et données non structurées – sont aujourd’hui répandues et acceptées. C’est la première et principale façon de caractériser les données dans la société de l’information, dans les entreprises et leurs directions des systèmes d’information (DSI) mais aussi, de plus en plus, pour les responsables métiers, pour les juristes et pour les professionnels de l’information.
On parle aussi d'”informations structurées” versus “informations non structurées”
Français
Données structurées
Données non structurées
Informations structurées
Informations non structurées
Anglais
Structured Data
Unstructured Data
Source : Accenture - applied intelligence glossary
Source : GDT - Traitement des données
Contributeurs: Claude Coulombe, wiki