Contexte
DeepSeek étant actuellement très populaire, notre entreprise a besoin de déployer localement ce modèle et de l'intégrer avec l'extension Page AI pour Google Chrome, permettant ainsi des conversations directemant dans le navigateur. Cependant, en raison des restrictions du pare-feu d'entreprise, une installation en ligne du modèle n'est pas possible. Cet article explique comment charger le modèle DeepSeek via Ollama hors ligne, puis configurer Page AI sur les postes clients pour accéder à DeepSeek.
Prérequis système
Configuration matérielle :
Processeur i5-12500 avec 12 cœurs, 16Go de RAM, carte graphique NVIDIA T400 4Go
Système d'exploitation :
Windows 10 LTSC 64 bits
Installation d'Ollama
Ollama est un outil open source pour le déploiement local de modèles de langage volumineux (LLM), conçu pour simplifier l'installation, l'exécution et la gestion de ces modèles.
Téléchargement : https://ollama.com/Visitez le site, cliquez sur Download et procédez à l'installation par simple exécution. L'installation par défaut se fait sur le lecteur C
Une fois l'installation terminée, exécutez la commande suivante dans PowerShell
PS C:\Users\Administrateur> ollama -v
ollama version is 0.5.11
PS C:\Users\Administrateur>
L'affichage de la version d'ollama confirme que l'installation a réussi
Conifguration du modèle DeepSeek
Étant donné la configuration matérielle, nous allons déployer la version 7B du modèle
Téléchargement manuel du modèle DeepSeek-R1
En raison des restrictions de pare-feu, le téléchargement automatique via Ollama n'est pas possible. Nous devrons donc télécharger manuellement le modèle.
Plateforme : https://www.modelscope.cn/Recherchez "DeepSeek-R1-Distill-Qwen-7B-GGUF"
Sélectionnez le premier résultat, accédez à la page de téléchargement et choisissez le fichier modèle comme indiqué
Copiez le fichier GGUF téléchargé dans un répertoire sans caractères spéciaux, par exemple : D:\logiciels\deepseek_r1 Créez un fichier nommé Modelfile (sans extension) dans ce répertoire Ouvrez Modelfile et ajoutez le contenu suivant, puis sauvegardez
FROM ./DeepSeek-R1-Distill-Qwen-7B-Q4_K_M.gguf
Ouvrez PowerShell dans le répertoire contenant le fichier GGUF et exécutez la commande pour enregistrer le service
PS D:\logiciels\deepseek_r1> Ollama create deepseek-r1:7b -f Modelfile
collecte des composants du modèle
copie du fichier sha256:78272d8d32084548bd450394a560eb2d70de8232ab96a725769b1f9171235c1c 100%
analyse du GGUF
utilisation de la couche existante sha256:78272d8d32084548bd450394a560eb2d70de8232ab96a725769b1f9171235c1c
écriture du manifeste
succès
PS D:\logiciels\deepseek_r1>
Ici, deepseek-r1:7b est le nom du service enregistré, et Modelfile est le fichier de configuration
Le message "succès" confirme que l'enregistrement a réussi !
Vérifiez les services enregistrés avec la commende ollama list
PS D:\logiciels\deepseek_r1> ollama list
NOM ID TAILLE MODIFIÉ
deepseek-r1:7b 32054698b4f4 4.7 Go il y a 57 secondes
Exécutez ollama run deepseek-r1:7b pour accéder à l'interface de dialogue. L'apparition de ">>>Envoyez un message" indique le démarrage réussi
PS D:\logiciels\deepseek_r1> ollama run deepseek-r1:7b
>>> Envoyez un message (/? pour l'aide)
Testez une conversation
DeepSeek est maintenant correctement installé
Intégration avec l'extension Page AI
Téléchargement de l'extension : https://www.chajianxw.com/product-tool/85997.html
Une fois téléchargée, installez l'extension dans Google Chrome. Ce processus n'est pas détaillé ici.
Dans l'interface de configuration de Page AI, l'URL par défaut est http://127.0.0.1:11434. Si d'autres ordinateurs du réseau local doivent y accéder, modifiez l'URL en utilisant l'adresse IP du serveur et activez l'option URL Ollama avancée avec la même adresse URL
Configuration des variables d'environnement du système
OLLAMA_HOST=0.0.0.0:11434
OLLAMA_MODELS=D:\logiciels\deepseek_r1
OLLAMA_HOST spécifie l'adresse d'accès au serveur, où 0.0.0.0 autorise l'accès à tous les utilisateurs OLLAMA_MODELS contient le chemin absolu vers les fichiers de modèle GGUF
Après cette configuration, le nom du service enregistré deepseek_r1:7b devrait être disponible
Enfin, retournez à l'interface de dialogue. Lorsque la page indique "Ollama en cours d'exécution", comme montré ci-dessus, l'ensemble du service est opérationnel