Système de Transcription de Réunions Multimodale basé sur DamoFD-0.5G et Reconnaissance Vocale

Le Défi de la Diarisation dans les Visioconférences Lors des réunions à distance, la superposition des voix et les bruits de fond rendent extrêmement difficile l'attribution correcte des transcriptions aux intervenants. Les systèmes traditionnels traitent l'audio et la vidéo de manière isolée, ce qui empêche d'identifier visuellement la personn ...

Publié le 4 juillet à 23h10