Clonage vocal en quelques coups


Révision datée du 19 mars 2026 à 16:18 par Arianne (discussion | contributions)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Définition

Technique de clonage vocal qui se concentre sur l'adaptation au locuteur (speaker adaptation) grâce à un peaufinage avec un minimum de données. L'audio de référence peut être de quelques secondes à cinq minutes maximum.

Voir aussi clonage vocal, synthèse de la parole et clonage vocal zéro-coup

Français

clonage vocal en quelques coups

clonage vocal avec peu d'exemples

clonage vocal avec quelques coups

clonage vocal à partir de peu d'exemples

clonage à multiples coups

Anglais

few-Shot voice cloning

few-shot TTS

FS-TTS

A voice cloning technique that focuses on speaker adaptation through fine tuning with minimal data. The reference audio can range from a few seconds to a maximum of five minutes.

Sources

Source : Arxiv

Source : Arxiv

Contributeurs: Arianne Arel, Patrick Drouin, wiki