Déploiement du modèle Youtu-VL-4B-Instruct pour la question-réponse sur images
Obtenir rapidement des réponses à partir d'images complexes, extraire du texte de captures d'écran ou simplement demander l'interprétation d'une photo : les modèles de langage visuels rendent ces tâches accessibles. Le modèle Youtu-VL-4B-Instruct, développé par le laboratoire Tencent YouTu, se distingue par sa légèreté (4 milliards de paramètre ...
Publié le 15 juin à 05h44