« Model Warm-Up » : différence entre les versions


(Page créée avec « == en construction == == Définition == Lors de la phase de déploiement d'un modèle qui a été préalablement entraîné, l'échauffement du modèle consiste à exécuter un petit nombre de requêtes d'inférence à un modèle pour initialiser tous ses composants.  == Compléments == Il est important d'observer si le temps de réponse moyen diminue jusqu'à la valeur de latence attendue en production à mesure que l'échauffement progresse. == Français ==... »)
 
Aucun résumé des modifications
Ligne 18 : Ligne 18 :
'' À trouver''
'' À trouver''


[[Catégroie:vocabulary]]
[[Catégorie:vocabulary]]

Version du 21 novembre 2024 à 17:35

en construction

Définition

Lors de la phase de déploiement d'un modèle qui a été préalablement entraîné, l'échauffement du modèle consiste à exécuter un petit nombre de requêtes d'inférence à un modèle pour initialiser tous ses composants. 

Compléments

Il est important d'observer si le temps de réponse moyen diminue jusqu'à la valeur de latence attendue en production à mesure que l'échauffement progresse.

Français

Échauffement du modèle

Échauffement à l'inférence

Anglais

Model Warm-up

Source

À trouver

Contributeurs: Arianne