LogoTeluq
English
Logo
Répertoire de publications
de recherche en accès libre

Faster population counts using AVX2 instructions [r-libre/1119]

Muła, Wojciech; Kurz, Nathan et Lemire, Daniel (sous presse). Faster population counts using AVX2 instructions. Computer Journal. https://doi.org/10.1093/comjnl/bxx046

Fichier(s) associé(s) à ce document :
[img]  PDF - faster-population-counts.pdf
Contenu du fichier : Manuscrit soumis (avant évaluation)
Licence : Creative Commons CC BY.
 
Catégorie de document : Articles de revues
Évaluation par un comité de lecture : Oui
Étape de publication : Accepté (sous presse)
Résumé : Counting the number of ones in a binary stream is a common operation in database, information-retrieval, cryptographic and machine-learning applications. Most processors have dedicated instructions to count the number of ones in a word (e.g., popcnt on x64 processors). Maybe surprisingly, we show that a vectorized approach using SIMD instructions can be twice as fast as using the dedicated instructions on recent Intel processors. The benefits can be even greater for applications such as similarity measures (e.g., the Jaccard index) that require additional Boolean operations. Our approach has been adopted by LLVM: it is used by its popular C compiler (Clang).
Déposant: Lemire, Daniel
Responsable : Daniel Lemire
Dépôt : 05 mai 2017 19:59
Dernière modification : 13 oct. 2017 01:02

Actions (connexion requise)

RÉVISER RÉVISER