LogoTeluq
English
Logo
Répertoire de publications
de recherche en accès libre

Tri de la table de faits et compression des index bitmaps avec alignement sur les mots [r-libre/222]

Aouiche, Kamel; Lemire, Daniel et Kaser, Owen (juin 2008). Tri de la table de faits et compression des index bitmaps avec alignement sur les mots. Communication présentée aux 24ièmes journées 'Bases de Données Avancées'.

Fichier(s) associé(s) à ce document :
[img]  PDF - 0805.3339v3.pdf  
Catégorie de document : Communications à des congrès/colloques et conférences (non publiées)
Évaluation par un comité de lecture : Oui
Étape de publication : Publié
Résumé : Bitmap indexes are frequently used to index multidimensional data. They rely mostly on sequential input/output. Bitmaps can be compressed to reduce input/output costs and minimize CPU usage. The most efficient compression techniques are based on run-length encoding (RLE), such as Word-Aligned Hybrid (WAH) compression. This type of compression accelerates logical operations (AND, OR) over the bitmaps. However, run-length encoding is sensitive to the order of the facts. Thus, we propose to sort the fact tables. We review lexicographic, Gray-code, and block-wise sorting. We found that a lexicographic sort improves compression--sometimes generating indexes twice as small--and make indexes several times faster. While sorting takes time, this is partially offset by the fact that it is faster to index a sorted table. Column order is significant: it is generally preferable to put the columns having more distinct values at the beginning. A block-wise sort is much less efficient than a full sort. Moreover, we found that Gray-code sorting is not better than lexicographic sorting when using word-aligned compression.
Déposant: Lemire, Daniel
Responsable : Daniel Lemire
Dépôt : 28 juill. 2014 18:16
Dernière modification : 18 juill. 2015 16:10

Actions (connexion requise)

RÉVISER RÉVISER