Système de Transcription de Réunions Multimodale basé sur DamoFD-0.5G et Reconnaissance Vocale
Le Défi de la Diarisation dans les Visioconférences
Lors des réunions à distance, la superposition des voix et les bruits de fond rendent extrêmement difficile l'attribution correcte des transcriptions aux intervenants. Les systèmes traditionnels traitent l'audio et la vidéo de manière isolée, ce qui empêche d'identifier visuellement la personn ...
Publié le 4 juillet à 23h10