Répertoire de publications
de recherche en accès libre
de recherche en accès libre
Keiser, John et Lemire, Daniel (2021). Validating UTF-8 In Less Than One Instruction Per Byte. Software: Practice and Experience, 51 (5), 950-964. https://doi.org/10.1002/spe.2920
Fichier(s) associé(s) à ce document :
PDF
- 2010.03090.pdf
Contenu du fichier : Manuscrit soumis (avant évaluation) Licence : Creative Commons CC BY. |
|
Catégorie de document : | Articles de revues |
---|---|
Évaluation par un comité de lecture : | Oui |
Étape de publication : | Publié |
Résumé : | The majority of text is stored in UTF-8, which must be validated on ingestion. We present the lookup algorithm, which outperforms UTF-8 validation routines used in many libraries and languages by more than 10 times using commonly available SIMD instructions. To ensure reproducibility, our work is freely available as open source software. |
Adresse de la version officielle : | https://onlinelibrary.wiley.com/doi/abs/10.1002/sp... |
Déposant: | Lemire, Daniel |
Responsable : | Daniel Lemire |
Dépôt : | 15 oct. 2020 13:53 |
Dernière modification : | 06 avr. 2021 13:29 |
RÉVISER |