« Clonage vocal » : différence entre les versions


Aucun résumé des modifications
Aucun résumé des modifications
 
Ligne 1 : Ligne 1 :
==en construction==
== Définition ==
== Définition ==
Méthode consistant à utiliser des '''[[Modèle|modèles]]''' d''''[[intelligence artificielle]]''' pour créer une copie numérique de la voix d'une personne, puis à générer de nouveaux échantillons vocaux à partir de cette voix unique. Les informations relatives à la voix sont stockées dans une '''[[représentation sémantique distributionnelle compacte]]'''.  
Méthode consistant à utiliser des '''[[Modèle|modèles]]''' d''''[[intelligence artificielle]]''' pour créer une copie numérique de la voix d'une personne, puis à générer de nouveaux échantillons vocaux à partir de cette voix unique. Les informations relatives à la voix sont stockées dans une '''[[représentation sémantique distributionnelle compacte]]'''.  
Ligne 25 : Ligne 23 :




[[Catégorie:publication]]
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]

Dernière version du 3 mars 2026 à 21:04

Définition

Méthode consistant à utiliser des modèles d'intelligence artificielle pour créer une copie numérique de la voix d'une personne, puis à générer de nouveaux échantillons vocaux à partir de cette voix unique. Les informations relatives à la voix sont stockées dans une représentation sémantique distributionnelle compacte.

Compléments

  • Le clonage vocal peut aussi être multimodal.
  • Attention! À ne pas confondre avec la synthèse de la parole, puisque l'objectif du clonage vocal est de reproduire la voix du locuteur et non de produire une voix artificielle à partir d'un texte.
  • La quantité de données requises est variable, certains pensent qu'il ne devrait y avoir aucune contrainte sur les données, tandis que d'autres pensent qu'elle devrait être limitée.

Français

clonage vocal

Anglais

voice cloning

Method of using AI models to create a digital copy of a person’s voice and then potentially generating new speech samples in that unique voice. The information around the voice is stored in an embedding. It also can be multilingual.

Sources

Source : arxiv

Source : newscientist

Source : Veritone Voice

Contributeurs: Arianne Arel, wiki