Top-p sampling
en construction
Définition
Stratégie de décodage stochastique pour générer des séquences à partir de modèles probabilistes autorégressifs qui introduisent un caractère aléatoire tout en conservant la qualité. Plus simplement, son principe fondamental consiste à échantillonner à chaque étape un ensemble plus petit et plus crédible de segments textuels (appelé noyau). Le choix de p peut influencer considérablement le texte généré.
Cette stratégie est utile lorsque l'on souhaite obtenir une génération de texte plus adaptée et plus sensible au contexte.
Voir aussi génération automatique de texte
Compléments
En pratique, le xxxxxx est souvent préféré au top-k(?) car il est adaptatif. Il est généralement recommandé de spécifier soit la température, soit le xxxxxx, mais pas les deux.
Français
XXXXXX
Anglais
Top-p sampling
Nucleus sampling
Stochastic decoding strategy for generating sequences form autoregressive probabilistic models that introduces randomness while maintaining quality. The choice of p can significantly influence the generated text. Its core idea is to sample from a smaller, more credible set of tokens at each step (called the nucleus). It is useful when you want more adaptative and context-sensitive text generation.
In practice, top-p sampling is often preferred over top-k because it’s adaptive. It is generally recommended to specify either the temperature or the top_p parameter, but not both.
Sources
Contributeurs: Arianne Arel
