
Open access research
publication repository
publication repository
Rocheleau, Sylvain (2019). Automatisation de la découverte de relations sémantiques entre contenus circulant sur les dispositifs sociotechniques (Doctoral dissertation, Université TÉLUQ, Québec, Canada). Advisor(s): Paquette, Gilbert, & George, Éric.
File(s) available for this item:![]() |
PDF
- Sylvain Rocheleau - Dépôt final.pdf
License : Creative Commons Attribution Non-commercial Share Alike. |
|
Item Type: | Doctoral Dissertations and Master's Theses |
---|---|
Refereed: | Yes |
Status: | Unpublished |
Abstract: | Les dispositifs sociotechniques tels que les réseaux sociaux (LinkedIn, Facebook, Google +), les sites de microblogues (Twitter, Identi.ca), les plateformes de partage de contenus (Digg, StumbleUpon, Buzznet) ou d'hébergement de contenus générés par les utilisateurs (Academia.edu, Youtube, DeviantArt, Flickr) génèrent un océan de données et de métadonnées. Plusieurs de ces plateformes s'en remettent partiellement aux utilisateurs lorsque vient le temps d'opérer une classification de leurs contenus. La méthode souvent privilégiée est celle qui permet l'ajout de mots-clés par les utilisateurs à leur propre contenu ou à celui des autres. Nous soutiendrons dans cette thèse qu'à partir des folksonomies qui se créent par le regroupement de mots-clés autour d'une thématique, on peut extraire un champ lexical présentant une cohésion sémantique parmi les mots-clés présentant une forte cooccurrence entre eux. Nous démontrerons ensuite que l'identification de sousthématiques est possible par la découverte de liens sémantiques de type partie-tout entre mots-clés – mots-clics sur Twitter – faisant partie d'un même champ lexical. Notre plus grand défi consiste à établir ces liens sémantiques en l'absence de ressources linguistiques telles que des dictionnaires ou des thésaurus puisque souvent les mots-clics utilisés par les utilisateurs sont des néologismes, des abréviations ou encore des mots composés. Ce défi est présent sur Twitter, notre objet d'expérimentation, mais également sur d’autres dispositifs sociotechniques. Dans le cas de Twitter, l'identification de sous-thématiques nous a permis de mettre en place un prototype de suivi de discussions autour de thématiques de discussions afin d'observer et de capter leur évolution dans le temps. Notre démarche comprend trois étapes soit la création de folksonomies par le regroupement de mots-clics, la création de champs lexicaux entre mots-clics affichant une forte cooccurrence entre eux et, finalement, l'attribution de relations sémantiques à ces derniers à partir de iii calculs statistiques. Les applications de la découverte de liens sémantiques entre mots-clés appartenant à une folksonomie sont vastes et pourraient être utiles entre autres à l'expansion de requêtes en recherche d'informations, à la création d'ontologies, à la mise en place d'outils de suggestions de contenu ou encore à l'organisation d'archives. |
Depositor: | Breault, Claude |
Owner / Manager: | Claude Breault |
Deposited: | 29 Apr 2019 19:24 |
Last Modified: | 29 Apr 2019 19:24 |
![]() |
RÉVISER |