« Model Warm-Up » : différence entre les versions
(Page créée avec « == en construction == == Définition == Lors de la phase de déploiement d'un modèle qui a été préalablement entraîné, l'échauffement du modèle consiste à exécuter un petit nombre de requêtes d'inférence à un modèle pour initialiser tous ses composants. == Compléments == Il est important d'observer si le temps de réponse moyen diminue jusqu'à la valeur de latence attendue en production à mesure que l'échauffement progresse. == Français ==... ») |
Aucun résumé des modifications |
||
(Une version intermédiaire par le même utilisateur non affichée) | |||
Ligne 14 : | Ligne 14 : | ||
== Anglais == | == Anglais == | ||
''' Model Warm-up''' | ''' Model Warm-up''' | ||
''' Model Warmup''' | |||
== Source == | == Source == | ||
'' À trouver'' | '' À trouver'' | ||
[[ | [[Catégorie:vocabulary]] |
Dernière version du 23 novembre 2024 à 15:51
en construction
Définition
Lors de la phase de déploiement d'un modèle qui a été préalablement entraîné, l'échauffement du modèle consiste à exécuter un petit nombre de requêtes d'inférence à un modèle pour initialiser tous ses composants.
Compléments
Il est important d'observer si le temps de réponse moyen diminue jusqu'à la valeur de latence attendue en production à mesure que l'échauffement progresse.
Français
Échauffement du modèle
Échauffement à l'inférence
Anglais
Model Warm-up
Model Warmup
Source
À trouver
Contributeurs: Arianne