« Suppression de segment textuel » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
Technique utilisée pour le '''[[préentraînement]]''' d’un modèle où les '''[[Segment textuel|segments textuels]]''' (tokens) sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.
Technique utilisée pour le '''[[préentraînement]]''' d’un '''[[modèle de langue|modèle]]''' où les '''[[Segment textuel|segments textuels]]''' sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.


== Français ==
== Français ==
''' Suppression de segment'''
''' suppression de segment textuel'''
 
''' destruction de segment textuel'''


== Anglais ==
== Anglais ==
''' Token Deletion'''
''' token deletion'''


<!--''Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.''-->
<!--''Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.''-->

Version du 10 juin 2025 à 15:24

en construction

Définition

Technique utilisée pour le préentraînement d’un modèle où les segments textuels sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.

Français

suppression de segment textuel

destruction de segment textuel

Anglais

token deletion

Sources

Source : arxiv

Source : GitHub

Contributeurs: Arianne