LogoTeluq
English
Logo
Répertoire de publications
de recherche en accès libre

On-Demand JSON: A Better Way to Parse Documents? [r-libre/3136]

Keiser, John et Lemire, Daniel (2024). On-Demand JSON: A Better Way to Parse Documents?. Software: Practice and Experience, 54 (6). https://doi.org/10.1002/spe.3313

Fichier(s) associé(s) à ce document :
[img]  PDF - ondemand-7.pdf
Contenu du fichier : Manuscrit soumis (avant évaluation)
Licence : Creative Commons CC BY.
 
Catégorie de document : Articles de revues
Évaluation par un comité de lecture : Oui
Étape de publication : Publié
Résumé : JSON is a popular standard for data interchange on the Internet. Ingesting JSON documents can be a performance bottleneck. A popular parsing strategy consists in converting the input text into a tree-based data structure---sometimes called a Document Object Model or DOM. We designed and implemented a novel JSON parsing interface---called On-Demand---that appears to the programmer like a conventional DOM-based approach. However, the underlying implementation is a pointer iterating through the content, only materializing the results (objects, arrays, strings, numbers) lazily.On recent commodity processors, an implementation of our approach provides superior performance in multiple benchmarks. To ensure reproducibility, our work is freely available as open source software. Several systems use On Demand: e.g., Apache Doris, the Node.js JavaScript runtime, Milvus, and Velox.
Déposant: Lemire, Daniel
Responsable : Daniel Lemire
Dépôt : 15 janv. 2024 21:07
Dernière modification : 06 mai 2024 14:50

Actions (connexion requise)

RÉVISER RÉVISER