Évaluer les capacités de raisonnement des LLM avec Chain-of-Thought Hub
Chain-of-Thought Hub est un framework open-source conçu pour mesurer les capacités de raisonnement complexe des grands modèles de langage (LLM). En exploitant la technique du "Chain-of-Thought" (chaîne de pensée), cet outil permet de comparer les performances de modèles tels que GPT-4, Claude ou Llama sur des tâches logiques ardues. C ...
Publié le 16 juin à 03h09