Répertoire de publications
de recherche en accès libre
de recherche en accès libre
Keiser, John et Lemire, Daniel (2021). Validating UTF-8 In Less Than One Instruction Per Byte. Software: Practice and Experience, 51 (5), 950-964. https://doi.org/10.1002/spe.2920
Fichier(s) associé(s) à ce document :|
PDF
- 2010.03090.pdf
Contenu du fichier : Manuscrit soumis (avant évaluation) Licence : Creative Commons CC BY. |
|
| Catégorie de document : | Articles de revues |
|---|---|
| Évaluation par un comité de lecture : | Oui |
| Étape de publication : | Publié |
| Résumé : | The majority of text is stored in UTF-8, which must be validated on ingestion. We present the lookup algorithm, which outperforms UTF-8 validation routines used in many libraries and languages by more than 10 times using commonly available SIMD instructions. To ensure reproducibility, our work is freely available as open source software. |
| Adresse de la version officielle : | https://onlinelibrary.wiley.com/doi/abs/10.1002/sp... |
| Déposant: | Lemire, Daniel |
| Responsable : | Daniel Lemire |
| Dépôt : | 15 oct. 2020 13:53 |
| Dernière modification : | 06 avr. 2021 13:29 |
|
RÉVISER |