« Clonage vocal en quelques coups » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
| Ligne 1 : | Ligne 1 : | ||
== Définition == | == Définition == | ||
Technique de '''[[clonage vocal]]''' qui se concentre sur l'[[adaptation au locuteur]] (''speaker adaptation'') grâce à un '''[[peaufinage]]''' avec un minimum de '''[[données]]'''. L'audio de référence peut être de quelques secondes à cinq minutes maximum. | Technique de '''[[clonage vocal]]''' qui se concentre sur l''''[[adaptation au locuteur]]''' (''speaker adaptation'') grâce à un '''[[peaufinage]]''' avec un minimum de '''[[données]]'''. L'audio de référence peut être de quelques secondes à cinq minutes maximum. | ||
Voir aussi '''[[clonage vocal]]''', '''[[synthèse de la parole]]''' et '''[[clonage vocal zéro-coup]]''' | Voir aussi '''[[clonage vocal]]''', '''[[synthèse de la parole]]''' et '''[[clonage vocal zéro-coup]]''' | ||
== Français == | == Français == | ||
''' | ''' clonage vocal en quelques coups''' | ||
''' | ''' clonage vocal avec peu d'exemples''' | ||
''' | ''' clonage vocal avec quelques coups''' | ||
''' | ''' clonage vocal à partir de peu d'exemples''' | ||
''' | ''' clonage à multiples coups''' | ||
== Anglais == | == Anglais == | ||
''' | ''' few-Shot voice cloning''' | ||
''' | ''' few-shot TTS''' | ||
''' FS-TTS''' | ''' FS-TTS''' | ||
Dernière version du 19 mars 2026 à 16:18
Définition
Technique de clonage vocal qui se concentre sur l'adaptation au locuteur (speaker adaptation) grâce à un peaufinage avec un minimum de données. L'audio de référence peut être de quelques secondes à cinq minutes maximum.
Voir aussi clonage vocal, synthèse de la parole et clonage vocal zéro-coup
Français
clonage vocal en quelques coups
clonage vocal avec peu d'exemples
clonage vocal avec quelques coups
clonage vocal à partir de peu d'exemples
clonage à multiples coups
Anglais
few-Shot voice cloning
few-shot TTS
FS-TTS
A voice cloning technique that focuses on speaker adaptation through fine tuning with minimal data. The reference audio can range from a few seconds to a maximum of five minutes.
Sources
Contributeurs: Arianne Arel, Patrick Drouin, wiki





