LogoTeluq
English
Logo
Répertoire de publications
de recherche en accès libre

Automatisation de la découverte de relations sémantiques entre contenus circulant sur les dispositifs sociotechniques [r-libre/1660]

Rocheleau, Sylvain (2019). Automatisation de la découverte de relations sémantiques entre contenus circulant sur les dispositifs sociotechniques (thèse de doctorat en Informatique cognitive, Université TÉLUQ, Québec, Canada). Direction : Paquette, Gilbert et George, Éric.

Fichier(s) associé(s) à ce document :
[img]  PDF - Sylvain Rocheleau - Dépôt final.pdf
Licence : Creative Commons CC BY-NC-SA.
 
Catégorie de document : Thèses et mémoires
Évaluation par un comité de lecture : Oui
Étape de publication : Non publié
Résumé : Les dispositifs sociotechniques tels que les réseaux sociaux (LinkedIn, Facebook, Google +), les sites de microblogues (Twitter, Identi.ca), les plateformes de partage de contenus (Digg, StumbleUpon, Buzznet) ou d'hébergement de contenus générés par les utilisateurs (Academia.edu, Youtube, DeviantArt, Flickr) génèrent un océan de données et de métadonnées. Plusieurs de ces plateformes s'en remettent partiellement aux utilisateurs lorsque vient le temps d'opérer une classification de leurs contenus. La méthode souvent privilégiée est celle qui permet l'ajout de mots-clés par les utilisateurs à leur propre contenu ou à celui des autres. Nous soutiendrons dans cette thèse qu'à partir des folksonomies qui se créent par le regroupement de mots-clés autour d'une thématique, on peut extraire un champ lexical présentant une cohésion sémantique parmi les mots-clés présentant une forte cooccurrence entre eux. Nous démontrerons ensuite que l'identification de sousthématiques est possible par la découverte de liens sémantiques de type partie-tout entre mots-clés – mots-clics sur Twitter – faisant partie d'un même champ lexical. Notre plus grand défi consiste à établir ces liens sémantiques en l'absence de ressources linguistiques telles que des dictionnaires ou des thésaurus puisque souvent les mots-clics utilisés par les utilisateurs sont des néologismes, des abréviations ou encore des mots composés. Ce défi est présent sur Twitter, notre objet d'expérimentation, mais également sur d’autres dispositifs sociotechniques. Dans le cas de Twitter, l'identification de sous-thématiques nous a permis de mettre en place un prototype de suivi de discussions autour de thématiques de discussions afin d'observer et de capter leur évolution dans le temps. Notre démarche comprend trois étapes soit la création de folksonomies par le regroupement de mots-clics, la création de champs lexicaux entre mots-clics affichant une forte cooccurrence entre eux et, finalement, l'attribution de relations sémantiques à ces derniers à partir de iii calculs statistiques. Les applications de la découverte de liens sémantiques entre mots-clés appartenant à une folksonomie sont vastes et pourraient être utiles entre autres à l'expansion de requêtes en recherche d'informations, à la création d'ontologies, à la mise en place d'outils de suggestions de contenu ou encore à l'organisation d'archives.
Déposant: Breault, Claude
Responsable : Claude Breault
Dépôt : 29 avr. 2019 19:24
Dernière modification : 29 avr. 2019 19:24

Actions (connexion requise)

RÉVISER RÉVISER