Évaluation de Qwen3-4B-Instruct-2507 : 256K de contexte et suivi d'instructions aux performances impressionnantes

Dans l'écosystème en constante évolution des modèles de langage open-source, une nouvelle étoile brille : Qwen3-4B-Instruct-2507. Ce modèle, avec ses modestes 4 milliards de paramètres, promet une capacité de contexte de 256 000 tokens, une caractéristique qui a suscité ma curiosité. Initialement, j'étais sceptique. À l'ère des modèles titanesq ...

Publié le 26 juin à 23h26