Distillation de modèles


Définition

La distillation de modèles aussi appelée distillation de connaissances est le processus qui permet de transférer les connaissances d'un grand modèle à un plus petit modèle sans perte de validité et en conservant la précision lors de la compression du modèle.

Compléments

Cette technique permet d’utiliser un modèle « enseignant » volumineux et coûteux pour entraîner un modèle « étudiant » à moindre coût.

Français

distillation de / des modèles

distillation de / des connaissances

Anglais

model distillation

knowledge distillation

Knowledge distillation is the process to transfer knowledge from large model to smaller one without loss of validity and retains accuracy with model compression.

Sources

Source : Wikipédia

Source : Proceeding Neurips

Source : Paper with code

Contributeurs: Arianne , Claude Coulombe, wiki