Optimisation du bucketing dans Hive

Le bucketing (ou segmentation) est une technique d'optimisation qui modifie la structure de stockage d'une table Hive. Contrairement au partitionnement qui découpe la table en sous-répertoires, le bucketing répartit les données dans plusieurs fichiers distincts. Le principe est de distribuer les enregistrements de manière aléatoire et uniforme ...

Publié le 3 juin à 00h33