Pratique d'auto-configuration du miroir Qwen3.5-9B-AWQ-4bit : Méthode de vérification du service web sur le port 7860 au démarrage

Aperçu du miroir

Le miroir Qwen3.5-9B-AWQ-4bit est un modèle multimodal capable de comprendre les images, combinant des images téléchargées avec des invites textuelles pour produire des analyses en chinois. Ce miroir est particulièrement adopté aux tâches suivantes :

Identification des éléments principaux d'une image
Description de scènes
Questions-réponses sur les images
Aide à la compréhension OCR simple

La version actuellement utilisée est la quantifiée cyankiwi/Qwen3.5-9B-AWQ-4bit, avec le modèle stocké dans le répertoire /root/ai-models/cyankiwi/Qwen___5-9B-AWQ-4bit.

Caractéristiques principales du miroir

Ce miroir est préconfiguré avec plusieurs fonctionnalités pratiques :

Interface web prête à l'emploi : Aucune configuration supplémentaire n'est nécessaire après le déploiement
Interaction visuelle : Prise en charge du téléchargement d'images et d'invites textuelles
Optimisation de sortie en chinois : Affichage direct des réponses finales en chinois sans processus intermédiaire
Prévention des soumissions en double : Le bouton "Commencer l'analyse" est désactivé automatiquement après clic
Démarrage automatique : Configuration de supervisor pour un démarrage automatique du service
Adaptation matérielle : Déployé sur deux cartes RTX 4090 D de 24GB pour un fonctionnement stable

Guide de démarrage rapide

3.1 Méthodes d'accès

Le service fonctionne par défaut sur le port 7860 et est accessible via :

https://gpu-{ID-instance}-7860.web.gpu.csdn.net/

3.2 Étapes d'utilisation de base

Ouvrir la page web
Télécharger une image à analyser
Saisir votre question dans le champ d'invite
Cliquer sur le bouton "Commencer l'analyse"
Attendre le résultat de compréhension du modèle en chinois

3.3 Invites de test recommandées

Voici quelques exemples d'invites courants et efficaces :

Décrivez le contenu principal de l'image.
Résumez les informations les plus importantes de cette image.
Lisez le texte de l'image et expliquez brièvement son contenu.
Identifiez l'objet ou la scène principale représentée dans cette image.

Détail des fonctions principales

4.1 Fonction de compréhension d'image

Idéale pour identifier les éléments, couleurs, structures et contenu des images.

Exemple d'invite : Décrivez le contenu principal de cette image et résumez ses caractéristiques principales.

4.2 Fonction de questions-réponses sur images

Permet de poser des questions sur le contenu d'une image, le modèle y répondant en se basant sur la visualisation.

Exemple d'invite : Quelle est l'information la plus notable dans cette image ?

4.3 Aide à la compréhension OCR

Utile pour l'assistance à la lecture lorsque l'image contient des tableaux, captures d'écran ou textes partiels.

Exemple d'invite : Lisez le texte de l'image et synthétisez son contenu principal.

Configuration des paramètres avancés

Paramètre	Description	Valeur recommandée
Longueur maximale de sortie	Contrôle la longueur du contenu retourné en une seule fois	192
Température	Contrôle la randomité, 0 pour plus de stabilité	0.7

Recommandations d'utilisation des paramètres :

Pour des réponses plus stables et concises, réduire la température à 0
Pour des réponses plus riches et variées, augmenter légèrement la température
Pour les tâches standard de reconnaissance, résumé et interprétation d'images, les paramètres par défaut sont suffisants

Gestion et vérification du service

6.1 Vérification de l'état du service

# Vérifier l'état d'exécution du service
supervisorctl status qwen35-9b-awq-vl-web

# Vérifier l'état de santé du service
curl http://127.0.0.1:7860/health

# Vérifier l'écoute du port
ss -ltnp | grep 7860

# Vérifier l'utilisation du GPU
nvidia-smi

# Consulter les journaux du service
tail -100 /root/workspace/qwen35-9b-awq-vl-web.log
tail -100 /root/workspace/qwen35-9b-awq-vl-web.err.log

6.2 Redémarrage du service

# Redémarrer le service web
supervisorctl restart qwen35-9b-awq-vl-web

Méthode de vérification du démarrage automatique

Pour garantir que le service se réactive automatiquement après un redémarrage du système, le miroir est géré par supervisor. Voici la méthode de vérification :

Confirmez d'abord l'état actuel du service :

supervisorctl status qwen35-9b-awq-vl-web

Simulez un redémarrage du système :

reboot

Après le redémarrage, vérifiez à nouveau l'état du service :

supervisorctl status qwen35-9b-awq-vl-web

Si l'état affiché est "RUNNING", la configuration de démarrage automatique est réussie.

Conseils et astuces d'utilisation
Conception des invites : Pour la compréhension d'images quotidiennes, utilisez des invites directes et claires
Reconnaissance de texte : Si l'image contient du texte, indiquez explicitement "Veuillez d'abord lire le texte, puis résumer"
Contrôle de sortie : Si le résultat est trop long, réduisez légèrement le paramètre de longueur maximale
Cas d'utilisation : Plus adapté aux tâches de compréhension visuelle, non recommandé pour une utilisation comme chat de conversation longue
Exigences matérielles : Le modèle quantifié est instable sur une seule carte de 24GB, une configuration à double carte est recommandée
Questions fréquentes

Q: Pourquoi le bouton devient-il gris après avoir cliqué ?

R: Ceci empêche les clics répétés qui provoqueraient des conflits de demandes simultanées. Après soumission, le bouton affiche "Analyse en cours..." et redevient utilisable lorsque le résultat est retourné.

Q: Que faire si j'obtiens le message "Modèle occupé" ?

R: Cela signifie que la demande précédente est encore en traitement. Attendez quelques secondes avant de réessayer.

Q: Pourquoi la version AWQ ne fonctionne-t-elle pas de manière stable sur une seule carte comme prévu ?

R: Le modèle quantifié utilise actuellement le chemin d'inférence transformers + compressed-tensors, avec un pic de mémoire supplémentaire lors de la génération initiale. Le test sur une seule carte de 24GB provoque un OOM (Out Of Memory) pendant la génération, d'où le choix d'un déploiement à double carte pour ce miroir.

Q: Pourquoi le processus de raisonnement n'est-il pas affiché sur la page ?

R: Le miroir actuel désactive les sorties intermédiaires de raisonnement pour ne conserver que la réponse finale, rendant l'interface plus épurée.

Q: Que faire si le service n'est pas accessible ?

R: Suivez ces étapes de dépannage :

# Vérifier l'état du service
supervisorctl status qwen35-9b-awq-vl-web

# Vérifier l'état de santé
curl http://127.0.0.1:7860/health

# Si le service n'est pas en cours d'exécution, essayez de le redémarrer
supervisorctl restart qwen35-9b-awq-vl-web

Étiquettes: Qwen3.5 AWQ modèle multimodal supervisor port 7860

Publié le 13 juin à 23h13

L'Atelier Monstre

Pratique d'auto-configuration du miroir Qwen3.5-9B-AWQ-4bit : Méthode de vérification du service web sur le port 7860 au démarrage

Étiquettes Populaires