Top-p sampling


Révision datée du 12 octobre 2025 à 16:53 par Arianne (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

en construction

Définition

Stratégie de décodage stochastique pour générer des séquences à partir de modèles probabilistes autorégressifs qui introduisent un caractère aléatoire tout en conservant la qualité. Plus simplement, son principe fondamental consiste à échantillonner à chaque étape un ensemble plus petit et plus crédible de segments textuels (appelé noyau). Le choix du paramètre p peut influencer considérablement le texte généré.

Cette stratégie est utile lorsque l'on souhaite obtenir une génération de texte plus adaptée et plus sensible au contexte.

Voir aussi génération automatique de texte

Compléments

En pratique, l'échantillonnage top-p est souvent préféré au top-k(?) car il est adaptatif. Il est généralement recommandé de spécifier soit la température, soit le paramètre p, mais pas les deux.

Français

Échantillonnage top-p

Échantillonnage du noyau

Anglais

Top-p sampling

Nucleus sampling

Stochastic decoding strategy for generating sequences form autoregressive probabilistic models that introduces randomness while maintaining quality. The choice of p can significantly influence the generated text. Its core idea is to sample from a smaller, more credible set of tokens at each step (called the nucleus). It is useful when you want more adaptative and context-sensitive text generation.

In practice, top-p sampling is often preferred over top-k because it’s adaptive. It is generally recommended to specify either the temperature or the top_p parameter, but not both.

Sources

Source : Medium

Source : The Large Language Model PLaybook

Source : Wikipedia

Contributeurs: Arianne Arel