« Suppression de segment textuel » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
(2 versions intermédiaires par un autre utilisateur non affichées)
Ligne 1 : Ligne 1 :
== en construction ==
== Définition ==
== Définition ==
Technique utilisée pour le '''[[préentraînement]]''' d’un modèle où les '''[[Segment textuel|segments textuels]]''' (tokens) sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.
Technique utilisée pour le '''[[préentraînement]]''' d’un '''[[modèle de langue|modèle]]''' où les '''[[Segment textuel|segments textuels]]''' sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.


== Français ==
== Français ==
''' Suppression de segment'''
''' suppression de segment textuel'''
 
''' destruction de segment textuel'''


== Anglais ==
== Anglais ==
''' Token Deletion'''
''' token deletion'''


<!--''Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.''-->
<!--''Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.''-->
Ligne 16 : Ligne 16 :
[https://yangyutu.github.io/llm_book.github.io/docs/chapter_foundation/t5.html  Source : GitHub]
[https://yangyutu.github.io/llm_book.github.io/docs/chapter_foundation/t5.html  Source : GitHub]


[[Catégorie:vocabulary]]
[[Catégorie:GRAND_LEXIQUE_FRANÇAIS]]

Dernière version du 5 août 2025 à 10:19

Définition

Technique utilisée pour le préentraînement d’un modèle où les segments textuels sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.

Français

suppression de segment textuel

destruction de segment textuel

Anglais

token deletion

Sources

Source : arxiv

Source : GitHub

Contributeurs: Arianne Arel, wiki