« Suppression de segment textuel » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
Ligne 2 : Ligne 2 :


== Définition ==
== Définition ==
Technique utilisée pour le '''[[préentraînement]]''' d’un modèle où les '''[[Segment textuel|segments textuels]]''' (ou segments) sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.
Technique utilisée pour le '''[[préentraînement]]''' d’un modèle où les '''[[Segment textuel|segments textuels]]''' (tokens) sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.


== Français ==
== Français ==
Ligne 10 : Ligne 10 :
''' Token Deletion'''
''' Token Deletion'''


''Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.''
<!--''Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.''-->
 
== Sources ==
== Sources ==
[https://arxiv.org/abs/2405.12630  Source : arxiv]
[https://arxiv.org/abs/2405.12630  Source : arxiv]

Version du 27 mai 2025 à 16:06

en construction

Définition

Technique utilisée pour le préentraînement d’un modèle où les segments textuels (tokens) sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les segments à partir desquels les positions sont supprimées.

Français

Suppression de segment

Anglais

Token Deletion

Sources

Source : arxiv

Source : GitHub

Contributeurs: Arianne