LogoTeluq
English
Logo
Répertoire de publications
de recherche en accès libre

Parsing Millions of URLs per Second [r-libre/3098]

Nizipli, Yagiz et Lemire, Daniel (2024). Parsing Millions of URLs per Second. Software: Practice and Experience, 54 (5). https://doi.org/10.1002/spe.3296

Fichier(s) associé(s) à ce document :
[img]  PDF - urlparser-14.pdf
Contenu du fichier : Manuscrit soumis (avant évaluation)
Licence : Creative Commons CC BY.
 
Catégorie de document : Articles de revues
Évaluation par un comité de lecture : Oui
Étape de publication : Publié
Résumé : URLs are fundamental elements of web applications. By applying vector algorithms, we built a fast standard-compliant C++ implementation. Our parser uses three times fewer instructions than competing parsers following the WHATWG standard (e.g., Servo's rust-url) and up to eight times fewer instructions than the popular curl parser. The Node.js environment adopted our C++ library. In our tests on realistic data, a recent Node.js version (20.0) with our parser is four to five times faster than the last version with the legacy URL parser.
Déposant: Lemire, Daniel
Responsable : Daniel Lemire
Dépôt : 20 nov. 2023 15:59
Dernière modification : 05 avr. 2024 15:25

Actions (connexion requise)

RÉVISER RÉVISER