Étapes typiques pour l'utilisation du service d'analyse Couchbase
Voici les étapes typiques pour utiliser le service d'analyse Couchbase, incluant le déploiement, la configuration, la création de jeux de données, l'exécution de requêtes ainsi que la surveillance et l'optimisation.
Commencez par installer et activer le service d'analyse ; ajoutez ensuite des nœuds au cluster et rééquilibrez ; puis mappez les collections du service de données dans Analytics pour créer les jeux de données ; exécutez ensuite des requêtes SQL++ for Analytics via diverses interfaces ; enfin, surveillez les indicateurs de fonctionnement du service d'analyse via la console Web ou l'API REST et optimisez en fonction des besoins en matière de partitionnement, d'indexation et d'isolation des ressources.
- Installation et déploiement du service d'analyse
-
Téléchargez et installez Couchbase Server Enterprise Edition (l'analyse est une fonctionnalité exclusive de l'édition Enterprise)
-
Dans la console Web, allez dans Servers → Add Server, entrez l'IP du nouveau nœud et les identifiants administrateur, et cochez uniquement les services Data et Analytics ; cliquez sur Add Server pour terminer l'ajout, puis exécutez Rebalance.
-
Pour ajouter un nœud existant au cluster, cliquez sur Join Existing Cluster dans la console Web de ce nœud, cochez uniquement Data et Analytics, entrez les informations du cluster et Rebalance.
-
Confirmez que le service d'analyse est activé dans le cluster : dans la barre de navigation gauche de la console, sélectionnez Analytics ; la page doit afficher le tableau de bord Analytics.
-
Initialisation du cluster et isolation des ressources
- Nœuds dédiés : Étant donné que les requêtes d'analyse sont généralement des tâches de grande envergure et de longue durée, il est recommandé de déployer le service d'analyse sur des nœuds dédiés afin d'éviter la concurrence de ressources avec les services Data, Query, Index, etc.
- Configuration des nœuds : Assurez-vous que le système d'exploitation permet aux processus liés à l'analyse (comme
cbas,cbas-engine, etc.) d'accéder aux fichiers et aux ports réseau, en particulier dans les environnements avec des logiciels de sécurité activés ou des stratégies de sécurité strictes.
- Création de jeux de données Analytics (Collections)
-
Ouvrez le Analytics Workbench (dans la console Web, Data Tools → Analytics) ou utilisez l'API REST/le shell
cbqpour vous connecter au port 8095 (ou 18095). -
Utilisez le DDL SQL++ pour mapper les collections du service de données que vous souhaitez analyser, par exemple : ``` ALTER COLLECTION
voyage-exemple.inventaire.aeroport ADD ANALYTICS COLLECTION analytics.aeroport; ALTER COLLECTIONvoyage-exemple.inventaire.hotel ADD ANALYTICS COLLECTION analytics.hotel;Cela créera des collections shadow corresponadntes dans le service d'analyse et démarrera automatiquement la synchronisation DCP. -
Opération visuelle : dans Workbench, vous pouvez également cliquer sur Map From Data Service Collections et sélectionner le bucket/cible de collection pour terminer le mapping en un seul clic.
-
Exécution de requêtes d'analyse
- Interfaces : Prise en charge de trois méthodes pour exécuter des requêtes SQL++ for Analytics : l'interface graphique d'Analytics Workbench, le shell de commande
cbqet l'API REST. - Exemple de validation : Vous pouvez d'abord exécuter un test simple : ```
"C'est l'heure des vacances !";
Si la chaîne est renvoyée correctement, le service est prêt. - Requêtes courantes : Prend en charge des opérations complexes comme jointures, agrégations, groupements, tris, etc., adaptées à l'analyse interactive ou par lots sur de grands ensembles de données.
- Surveillance et gestion
-
Indicateurs Analytics : Interrogez via l'API REST de Couchbase les indicateurs cbas (comme
cbas_active_links,cbas_direct_memory_used_bytes, etc.) pour suivre en temps réel le nombre de liens actifs, l'utilisation mémoire, les partitions de latence, etc. -
Tableau de bord de la console Web : Sur la page Dashboard, sélectionnez les nœuds et services pertinents pour visualiser divers graphiques statistiques et informations d'alerte.
-
Historique et audit des requêtes : Analytics Workbench enregistre toutes les requêtes exécutées (sans les résultats), avec persistance entre sessions, facilitant ainsi la reproductibilité et l'audit.
-
Optimisation des performances et meilleures pratiques
- Stratégie de partitionnement : Configurez judicieusement les champs de partitionnement hash en fonction de la quantité de données et des modèles de requêtes pour équilibrer la charge des nœuds et réduire la communication inter-nœuds.
- Conception d'index : Créez des index secondaires sur les colonnes à forte fréquence de filtrage pour améliorer considérablement les performances des requêtes ; pour les scénarios d'analyse ad hoc de table entière, vous pouvez vous appuyer sur l'avantage du traitement parallèle d'Analytics sans nécessiter d'index.
- Isolation des ressources : Déployez le service d'analyse sur des nœuds dédiés et attribuez-lui une mémoire et des cœurs CPU suffisants pour répondre aux besoins de haute parallélisation du traitement MPP.
En suivant ces étapes, vous pouvez déployer, configurer et utiliser avec succès le service d'analyse dans votre cluster Couchbase, permettant une analyse parallèle en temps réel de grands volumes de données JSON. Pour une compréhension plus approfondie des commandes détaillées ou de la référence de l'API REST, veuillez consulter la documentation officielle.