GLM-TTS : Synthèse Vocale Zero-Shot Avancée Propulsée par l'Apprentissage par Renforcement
Points clés :
Excellence open-source : GLM-TTS atteint le taux d'erreur de caractères (CER) le plus bas (0.89) parmi les modèles TTS open-source tout en maintenant une haute similarité du locuteur.
Capacité zero-shot : Clonez n'importe quelle voix avec seulement 3 à 10 secondes d'audio de référence, sans nécessiter d'entraînement.
Émotion amél ...
Publié le 14 juin à 23h16