« Échantillonnage à troncature k fixe » : différence entre les versions


(Page créée avec « == en construction == == Définition == xxxxxxx Voir aussi '''échantillonnage des p-meilleurs''' == Français == ''' Échantillonnage des k-meilleurs''' == Anglais == ''' Top-k sampling''' == Sources == [https://medium.com/thinking-sand/the-top-k-and-top-p-parameters-explained-bfaecc8cd342 Source : Medium] [https://cyrilzakka.github.io/llm-playbook/nested/topk.html Source : The Large Language Model Playbook] [https://en.wikipedia.org/wiki/Top-p_sa... »)
 
Aucun résumé des modifications
 
(16 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== en construction ==
== Définition ==


== Définition ==
Stratégie d'échantillonnage qui prélève un élément parmi un nombre fixe ''k'' des meilleurs éléments d'un ensemble. La valeur de ''k'' reste constante,
xxxxxxx
 
Ceci signifie que la méthode ne s'adapte pas au contexte, ce qui a conduit à l''''[[échantillonnage à troncature de masse p]]'''.
 
== Compléments ==
Cette stratégie d'échantillonnage est utilisée par les [[Grand modèle de langues|grands modèles de langues]] pour choisir aléatoirement un segment parmi un nombre fixe ''k'' de '''[[Segment textuel|segments textuels]]'''. La valeur de ''k'' reste constante, ce qui signifie que la méthode ne s'adapte pas au contexte du texte généré.
 
Une valeur ''k'' plus petite rendra le résultat plus ciblé mais moins créatif, tandis qu'une valeur ''k'' plus grande rendra le résultat plus diversifié mais potentiellement moins pertinent.


Voir aussi '''[[échantillonnage des p-meilleurs]]'''
Cette limitation a conduit à l''''[[échantillonnage à troncature de masse p]]'''.
<hr>
Le terme « échantillonnage à troncature ''k'' fixe » est plus exact que terme « échantillonnage des ''k'' meilleurs » car elle définit l'action algorithmique (la troncature) plutôt que simplement le résultat.
<hr>
Attention: À ne pas confondre avec la '''[[température]]''' d'un grand modèle de langues.


== Français ==
== Français ==
''' Échantillonnage des k-meilleurs'''
'''Échantillonnage à troncature k fixe'''
 
'''Échantillonnage parmi les k meilleurs'''
 
'''Échantillonnage Top-k'''


== Anglais ==
== Anglais ==
''' Top-k sampling'''
''' Top-k sampling'''


== Sources ==
''Sampling strategy that always samples from a fixed number of tokens, which may be too restrictive or too broad depending on the context. The value of K remains constant, meaning the method isn't adaptive to the context of the text being generated, which led to top-p sampling.''
[https://medium.com/thinking-sand/the-top-k-and-top-p-parameters-explained-bfaecc8cd342  Source : Medium]


[https://cyrilzakka.github.io/llm-playbook/nested/topk.html  Source : The Large Language Model Playbook]
''A smaller K will make the output more focused but less creative, while a larger K will make the output more diverse but potentially less relevant.''


[https://en.wikipedia.org/wiki/Top-p_sampling#Top-k_sampling   Source : Wikipedia]
== Sources ==
[https://medium.com/thinking-sand/the-top-k-and-top-p-parameters-explained-bfaecc8cd342   Source : Medium - Top-k sampling, Top-p sampling]


[[Catégorie:vocabulary]]
[https://en.wikipedia.org/wiki/Top-p_sampling#Top-k_sampling  Wikipedia - Top-k sampling]

Dernière version du 11 mars 2026 à 02:44

Définition

Stratégie d'échantillonnage qui prélève un élément parmi un nombre fixe k des meilleurs éléments d'un ensemble. La valeur de k reste constante,

Ceci signifie que la méthode ne s'adapte pas au contexte, ce qui a conduit à l'échantillonnage à troncature de masse p.

Compléments

Cette stratégie d'échantillonnage est utilisée par les grands modèles de langues pour choisir aléatoirement un segment parmi un nombre fixe k de segments textuels. La valeur de k reste constante, ce qui signifie que la méthode ne s'adapte pas au contexte du texte généré.

Une valeur k plus petite rendra le résultat plus ciblé mais moins créatif, tandis qu'une valeur k plus grande rendra le résultat plus diversifié mais potentiellement moins pertinent.

Cette limitation a conduit à l'échantillonnage à troncature de masse p.


Le terme « échantillonnage à troncature k fixe » est plus exact que terme « échantillonnage des k meilleurs » car elle définit l'action algorithmique (la troncature) plutôt que simplement le résultat.


Attention: À ne pas confondre avec la température d'un grand modèle de langues.

Français

Échantillonnage à troncature k fixe

Échantillonnage parmi les k meilleurs

Échantillonnage Top-k

Anglais

Top-k sampling

Sampling strategy that always samples from a fixed number of tokens, which may be too restrictive or too broad depending on the context. The value of K remains constant, meaning the method isn't adaptive to the context of the text being generated, which led to top-p sampling.

A smaller K will make the output more focused but less creative, while a larger K will make the output more diverse but potentially less relevant.

Sources

Source : Medium - Top-k sampling, Top-p sampling

Wikipedia - Top-k sampling

Contributeurs: Arianne Arel, Claude Coulombe, wiki