GLM-TTS : Synthèse Vocale Zero-Shot Avancée Propulsée par l'Apprentissage par Renforcement

Points clés : Excellence open-source : GLM-TTS atteint le taux d'erreur de caractères (CER) le plus bas (0.89) parmi les modèles TTS open-source tout en maintenant une haute similarité du locuteur. Capacité zero-shot : Clonez n'importe quelle voix avec seulement 3 à 10 secondes d'audio de référence, sans nécessiter d'entraînement. Émotion amél ...

Publié le 14 juin à 23h16