« Base de données vectorielles » : différence entre les versions


Aucun résumé des modifications
m (Patrickdrouin a déplacé la page Vector database vers Base de données vectorielles)
(Aucune différence)

Version du 18 juillet 2023 à 14:58

Définition

Les bases de données vectorielles sont des bases de données spécialement conçues pour effectuer une recherche approximative du plus proche voisin sur de grands ensembles de vecteurs de grande dimension (généralement plus de 100 dimensions et parfois plus de 10 000). Ces vecteurs cherchent à représenter la sémantique de données non structurées.

Compléments

Une base de données vectorielle est un système de gestion de bases de données (SGBD) spécialisé qui stocke des vecteurs contextuels denses en utilisant des techniques innovantes pour le stockage, l'indexation et le traitement des requêtes.

Les bases de données vectorielles permettent de stocker et de récupérer des vecteurs sous forme de points en hautes dimensions. Elles ajoutent des fonctionnalités supplémentaires pour une recherche efficace et rapide des voisins les plus proches dans l'espace à N-dimensions. Elles sont généralement alimentées par des index construits à l'aide d'algorithme comme kPPV (algorithme des k plus proches voisins)

et construites à l'aide d'algorithmes tels que le HNSW (Hierarchical Navigable Small World) et l'IVF (Inverted File Index).

Français

base de données vectorielles

Anglais

vector database

Source : KX

Source: Amazon Web Services (AWS)

Contributeurs: Patrick Drouin, wiki