Échauffement du modèle


Révision datée du 5 août 2025 à 10:05 par Pitpitt (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Lors de la phase de déploiement d'un modèle qui a été préalablement entraîné, l'échauffement du modèle consiste à exécuter un petit nombre de requêtes d'inférence à un modèle pour initialiser tous ses composants. 

Compléments

Il est important d'observer si le temps de réponse moyen diminue jusqu'à la valeur de latence attendue en production à mesure que l'échauffement progresse.

Français

Échauffement du modèle

Échauffement à l'inférence

Anglais

Model Warm-up

Model Warmup

Sources

Contributeurs: Arianne Arel, wiki