- Introduction : Pourquoi choisir EVA-01 ?
Si vous êtes utilisateur de Windows et que vous êtes fasciné par les applications d'IA multimodale, ce tutoriel est conçu pour vous. EVA-01, un nom évoquant les films de science-fiction, est en réalité un projet open-source qui combine les capacités puissantes de l'IA avec une interface visuelle saisissante.
En bref, il vous permet d'utiliser une interface très élégante pour dialoguer avec une IA "en voyant des images". Vous pouvez télécharger une image et poser des questions sur celle-ci - comme "Qu'y a-t-il sur cette image ?", "Décris-moi cette scène", ou même des questions plus complexes comme "Analyse la composition et la palette de couleurs de cette image".
Les deux points forts de ce projet sont : premièrement, il repose sur Qwen2.5-VL-7B, l'un des modèles multimodaux de pointe actuels avec une excellente capacité de compréhension des images ; deuxièmement, son interface est inspirée de l'Evangelion Unité-01, adoptant un style unique de "mecha blanc diurne" qui donne une sensation très particulière lors de son utilisation.
Ce guide vous montrera étape par étape comment déployer EVA-01 sur votre système Windows via WSL2 (Windows Subsystem for Linux) et configurer l'utilisation de votre carte NVIDIA (GPU) pour accélérer son exécution et obtenir des temps de réponse plus rapides. Aucune expertise en Linux n'est requise, il vous suffira de suivre les instructions.
- Prérequis : Vérification de votre configuration
Avant de commencer l'installation, nous devons nous assurer que votre ordinateur répond aux exigences de base et que l'environnement logiciel est prêt. Ne vous inquiétez pas, il s'agit principalement de vérifications.
2.1 Exigences matérielles et système
Vérifiez d'abord si votre ordinateur répond aux spécifications requises :
- Système d'exploitation : Windows 10 version 2004 ou ultérieure (version interne 19041 ou ultérieure) ou Windows 11. C'est l'exigence minimale pour exécuter WSL2.
- Mémoire vive : Au moins 16 GB recommandés. Les modèles d'IA consomment beaucoup de mémoire lors de leur exécution.
- Espace de stockage : Prévoyez au moins 20 GB d'espace libre pour l'installation du système Linux, de l'environnement Python et des fichiers du modèle d'IA.
- Carte graphique (essentiel !) : C'est le cœur de l'accélération GPU. Vous avez besoin d'une carte NVIDIA avec au moins 8 GB de VRAM (comme les RTX 3060, 3070, 4060, 4070, etc.). Plus la VRAM est importante, plus la résolution des images traitées peut être élevée et plus rapide sera le traitement.
2.2 Préparation de l'environnement logiciel
Ensuite, nous devons configurer un "sous-système" Linux sur Windows et installer le pilote de la carte graphique.
-
Activation des fonctionnalités WSL2 :
- Ouvrez PowerShell en tant qu'administrateur (recherchez "PowerShell" dans le menu Démarrer et cliquez avec le bouton droit sur "Exécuter en tant qu'administrateur").
- Saisissez la commande suivante et appuyez sur Entrée :
wsl --install - Cette commande installera par défaut la distribution Ubuntu et activera les fonctionnalités de virtualisation nécessaires. Un redémarrage de l'ordinateur sera ensuite requis.
-
Installation du pilote NVIDIA pour WSL2 :
- C'est l'étape la plus cruciale ! Le pilote de jeu Windows standard n'est pas compatible avec WSL2.
- Accédez à la page de téléchargement des pilotes WSL2 sur le site officiel de NVIDIA.
- Téléchargez et installez le "NVIDIA GPU Driver for Windows WSL" adapté à votre modèle de carte graphique.
- Une fois l'installation terminée, redémarrez à nouveau votre ordinateur.
-
Installation de Visual Studio Code (optionnel mais recommandé) :
- Téléchargez et installez VSCode depuis le site officiel. Par la suite, nous pourrons utiliser VSCode sous Windows pour nous connecter et opérer directement dans l'environnement Linux de WSL2, ce qui est très pratique.
-
Guide de déploiement étape par étape : Mise en route de votre "Unité-01"
Après le redémarrage, entrons dans la phase de déploiement. Veuillez suivre les étapes dans l'ordre.
3.1 Étape 1 : Configuration de l'environnement WSL2 et Linux
- Ouvrez l'application "Ubuntu" depuis le menu Démarrer. Pour la première utilisation, patientez quelques minutes pour que l'initialisation se termine, puis définissez un nom d'utilisateur et un mot de passe Linux (le mot de passe ne s'affiche pas pendant la saisie, tapez-le et appuyez sur Entrée).
- Mettez d'abord à jour la liste des paquets système :
sudo apt update && sudo apt upgrade -y - Installez quelques outils nécessaires, par exemple pour les compilations de code qui pourraient être requises par la suite :
sudo apt install -y build-essential
3.2 Étape 2 : Installation de Miniconda (gestionnaire d'environnement Python)
Dans l'environnement Linux, nous utilisons Miniconda pour gérer les versions de Python et les dépendances du projet, ce qui permet d'éviter les conflits entre différents paquets.
-
Téléchargez le script d'installation de Miniconda :
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh -
Exécutez le script d'installation :
bash Miniconda3-latest-Linux-x86_64.sh -
Lors de l'installation :
- Appuyez sur Entrée pour continuer à lire l'accord de licence, puis saisissez
yespour l'accepter. - Quand on vous demande le chemin d'installation, appuyez simplement sur Entrée pour utiliser le chemin par défaut.
- Finalement, quand on vous demande d'initialiser Conda, choisissez
yes.
- Appuyez sur Entrée pour continuer à lire l'accord de licence, puis saisissez
-
Fermez le terminal actuel, rouvrez un terminal Ubuntu pour que la configuration prenne effet. Vous remarquerez que le prompt de commande affiche maintenant
(base), ce qui indique que Conda est activé.
3.3 Étape 3 : Création d'un environnement Python dédié et installation de PyTorch
Différents projets d'IA nécessitent différentes versions de bibliothèques. Nous allons créer un environnement indépendant pour EVA-01.
- Créez un environnement Python nommé
eva01:conda create -n eva01 python=3.10 -y - Activez cet environnement :
conda activate eva01 - Une fois activé, le préfixe de la commande passera de
(base)à(eva01). - Installation de PyTorch avec support GPU : C'est le framework de calcul qui exécute le modèle d'IA.
- Visitez le site officiel de PyTorch pour obtenir la dernière commande d'installation. Pour CUDA 12.1, la commande est généralement : ```
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
- Après l'installation, vous pouvez vérifier si le GPU est utilisable. Testez dans un environnement Python interactif : ```
python -c "import torch; print(f'Version PyTorch: {torch.version}'); print(f'CUDA disponible: {torch.cuda.is_available()}'); print(f'Dispositif GPU: {torch.cuda.get_device_name(0) if torch.cuda.is_available() else "Aucun"}')"
- Si vous voyez
CUDA disponible: Trueainsi que le modèle de votre carte graphique, félicitations, la configuration GPU est réussie !
- Visitez le site officiel de PyTorch pour obtenir la dernière commande d'installation. Pour CUDA 12.1, la commande est généralement : ```
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
3.4 Étape 4 : Clonage du projet et installation des dépendances
-
Installez l'outil de contrôle de versions Git (si ce n'est déjà fait) :
sudo apt install -y git -
Clonez le projet EVA-01 localement :
git clone https://github.com/votre-repo/EVA-01.git*Note : Remplacezvotre-repopar l'adresse réelle du dépôt GitHub.* -
Accédez au répertoire du projet :
cd EVA-01 -
Installez les autres paquets Python requis par le projet. Le projet fournit généralement un fichier
requirements.txt:pip install -r requirements.txtCe processus peut prendre un certain temps, soyez patient.Si un paquet échoue à s'installer, vous pouvez essayer de l'installer individuellement ou rechercher les informations d'erreur pour trouver une solution.
3.5 Étape 5 : Téléchargement des poids du modèle IA
Le cœur d'EVA-01 est le modèle Qwen2.5-VL-7B. Nous devons télécharger ce pré-entraîné "cerveau".
-
Selon les instructions du README du projet, vous devrez peut-être télécharger le modèle via Hugging Face ou ModelScope.
-
Une méthode courante consiste à utiliser
git lfs(Large File Storage). Assurez-vous d'abord qu'il est installé : ``` sudo apt install -y git-lfs git lfs install -
Ensuite, clonez depuis le dépôt du modèle (exemple, l'adresse réelle dépend de la documentation du projet) : ``` git clone https://huggingface.co/Qwen/Qwen2.5-VL-7B-Instruct ./modele
-
*Note* : Les fichiers du modèle sont volumineux (environ 14 GB), le temps de téléchargement dépend de votre vitesse de connexion.
Une fois le téléchargement terminé, assurez-vous que les fichiers du modèle se trouvent dans le dossier
modeleà la racine du projet.
3.6 Étape 6 : Configuration et exécution de l'interface web
EVA-01 utilise Streamlit pour fournir une interface web opérationnelle.
- Vérifiez s'il existe dans le répertoire du projet un fichier principal comme
app.pyouwebui.py, ainsi qu'un fichier de configuration commeconfig.yamlou.env. - Généralement, vous devrez modifier le fichier de configuration pour spécifier le chemin du modèle. Ouvrez le fichier de configuration avec un éditeur de texte, par exemple :
nano config.yaml - Trouvez l'option de configuration
model_pathoumodel_nameet modifiez-la pour indiquer le chemin local du modèle téléchargé, par exemple./modele. Enregistrez et quittez (dans l'éditeur nano, appuyez surCtrl+X, puisY, puis Entrée). - Exécutez l'application Streamlit :
streamlit run app.py --server.port 8501 --server.address 0.0.0.0--server.port 8501spécifie le port.--server.address 0.0.0.0permet l'accès depuis l'hôte Windows.
- Si tout se passe bien, le terminal affichera une adresse réseau locale, généralement
http://localhost:8501ouhttp://0.0.0.0:8501.
3.7 Étape 7 : Accès depuis le navigateur Windows
Maintenant, ouvrez n'importe quel navigateur sur votre système Windows (Chrome, Edge, etc.) et tapez dans la barre d'adresse :
http://localhost:8501
Vous devriez voir l'interface d'EVA-01, pleine de style technologique et de mecha ! Essayez de télécharger une image et saisissez des instructions pour expérimenter le dialogue multimodal avec l'IA.
- Problèmes courants et dépannage
Le processus de déploiement rencontre rarement des obstacles sans encombre. Voici quelques points de blocage fréquents :
- WSL2 ne démarre/échoue à s'installer : Assurez-vous que dans "Activer ou désactiver les fonctionnalités Windows", vous avez coché "Plateforme de machine virtuelle" et "Sous-système Windows pour Linux". Vérifiez également que la virtualisation CPU (VT-x/AMD-V) est activée dans le BIOS.
torch.cuda.is_available()renvoie False :- Confirmez que vous avez installé le pilote NVIDIA pour WSL2.
- Dans le terminal Ubuntu de WSL2, saisissez
nvidia-smipour voir si la carte graphique et le pilote sont reconnus. Si ce n'est pas le cas, retournez sous Windows, saisissezwsl --shutdowndans PowerShell pour fermer complètement WSL, puis redémarrez Ubuntu. - Assurez-vous que la version CUDA dans la commande d'installation de PyTorch est compatible avec votre pilote.
- Erreur de port lors de l'exécution de Streamlit : Vous pouvez changer de port, par exemple en remplaçant
8501par8502dans la commande. - Erreur de mémoire insuffisante (OOM) lors du chargement du modèle : C'est le problème le plus courant. Qwen2.5-VL-7B nécessite une VRAM importante.
- Tentative 1 : Dans le fichier de configuration du projet, trouvez le paramètre limitant la résolution maximale des images d'entrée (comme
max_pixels) et réduisez-la (par exemple à1024*1024). - Tentative 2 : Si la VRAM est vraiment trop faible (par exemple 6 GB), vous devrez peut-être envisager d'utiliser une version quantifiée (comme la quantification 4 bits) du modèle, mais cela nécessite généralement de modifier le code de chargement du modèle, ce qui est plus complexe.
- Tentative 1 : Dans le fichier de configuration du projet, trouvez le paramètre limitant la résolution maximale des images d'entrée (comme
- Conflits d'installation des dépendances : Privilégiez l'utilisation du
requirements.txtfourni par le projet. Si cela échoue, essayez de mettre d'abord à jour pip :pip install --upgrade pip, puis réinstallez.
- Conclusion
Félicitations ! Vous avez maintenant déployé avec succès l'application multimodale EVA-01 à l'interface saisissante dans l'environnement WSL2 de Windows, avec activation de l'accélération GPU. Reprenons notre parcours :
- Phase de préparation : Vérification du matériel, activation de WSL2, installation du pilote NVIDIA dédié.
- Configuration de l'environnement : Installation du sous-système Linux, configuration de Miniconda pour gérer Python, installation de PyTorch avec support GPU.
- Déploiement de l'application : Clonage du code source, installation des dépendances, téléchargement du volumineux modèle IA.
- Mise en route et expérience : Configuration du chemin du modèle, exécution du service web, accès au dialogue visuel dans le navigateur.
Ce processus, bien que comportant plusieurs étapes, établit une base pour une expérience finale fluide. Vous pouvez maintenant explorer pleinement les capacités d'EVA-01 - l'utiliser pour analyser des plans de conception, interpréter des graphiques complexes, décrire des photos intéressantes, ou simplement profiter de l'expérience unique de dialoguer avec une IA ayant une coquille "Unité-01".