LogoTeluq
English
Logo
Répertoire de publications
de recherche en accès libre

Transcoding Billions of Unicode Characters per Second with SIMD Instructions [r-libre/2400]

Lemire, Daniel et Muła, Wojciech (2022). Transcoding Billions of Unicode Characters per Second with SIMD Instructions. Software: Practice and Experience, 52 (2).

Fichier(s) associé(s) à ce document :
[img]  PDF - Transcoding Billions of Unicode Characters per Second with SIMD Instructions.pdf
Contenu du fichier : Manuscrit soumis (avant évaluation)
Licence : Creative Commons - Transfert dans le domaine public.
 
Catégorie de document : Articles de revues
Évaluation par un comité de lecture : Oui
Étape de publication : Publié
Résumé : In software, text is often represented using Unicode formats (UTF-8 and UTF-16). We frequently have to convert text from one format to the other, a process called transcoding. Popular transcoding functions are slower than state-of-the-art disks and networks. These transcoding functions make little use of the single-instruction-multiple-data (SIMD) instructions available on commodity processors. By designing transcoding algorithms for SIMD instructions, we multiply the speed of transcoding on current systems (x64 and ARM). To ensure reproducibility, we make our software freely available as an open source library.
Déposant: Lemire, Daniel
Responsable : Daniel Lemire
Dépôt : 22 sept. 2021 16:00
Dernière modification : 04 févr. 2022 14:49

Actions (connexion requise)

RÉVISER RÉVISER