Show simple document record

Other titre : Suivi des Communautés dans les Réseaux Sociaux Dynamiques

dc.contributor.advisorWang, Shengrui
dc.contributor.authorZiwei Hefr
dc.date.accessioned2018-07-12T13:51:39Z
dc.date.available2018-07-12T13:51:39Z
dc.date.created2018fr
dc.date.issued2018-07-12
dc.identifier.urihttp://hdl.handle.net/11143/12845
dc.description.abstractA social network is a social structure of people related to each other through a common relationship or interest, and the process of investigating it through network and graph theories is called social network analysis. In the last decade, modeling and mining social networks have attracted more and more attention, many researchers are seeking to reveal hidden patterns and their evolutions which can capture interactions between people and groups of people, as well as the associated resources for understanding their behavior. In our research, we focused on finding and analyzing the evolution of communities in dynamic social networks, which is also known as tracking communities over time. To achieve this, a community-matching strategy is devised, each evolving community will be characterized by a series of significant evolutionary communities. In the social network analysis area, most of the authors just focus on detecting changes (critical events like form, expand, merge, split, etc.) communities may undergo. And they evaluate their algorithms by looking at the number of occurrences of critical events during the whole time period, barely focus on tracking community itself. Several methods for tracking communities have been proposed, most of which use however a sequential approach to perform one-to-one community mapping, and the communities are compared in terms of shared-nodes (mostly used Jaccard Coefficient based similarity measure) at only consecutive timestamps. Such one-sided approaches could lead us to a wrong direction of tracking which neglects the social positions of community members and decreases the possibilities of finding the maximum potential evolutions. To alleviate the limitations mentioned above, we propose a new algorithm for tracking communities. We adopted a two-stage process as follows: first independently detecting communities at each snapshot, then performing many-to-many communitymatching on the whole time period with a novel similarity measure to generate a sequence to represent the evolution. The similarity measure we proposed is capable of not only capturing shared-nodes proportion numerically (content similarity), but also the importance of their common members (member quality), and time proximity between communities when we match them. For the tracking strategy, we maximize the pair-wise similarity over all selected matches, which allows for many-to-many mappings between communities across different time steps. The matching is implemented over the entire observation period. It means our method will be able to maximize the potential evolutions we could find. To demonstrate the capacity of the proposed approach to increase the accuracy of tracking, we performed experimental studies. We carried a comparative study between four existing approaches and our proposed approach for tracking communities to clarify their strength and weakness. In our analysis, we compare the algorithms separately in two main community sets: (1) when groups of users do not overlap and (2) when the groups overlap. After communities are extracted, we implement the five approaches with the same set-up (including same similarity threshold selection method and evaluation criteria) on three different testbeds, extracted from the DBLP, Autonomous System (AS) and Yelp datasets. The community we can successfully tracked from each approach can lead us to a conclusion: our approach is efficient enough to capture community evolutions over time, and at the same time, has remarkably improved the accuracy of tracking.fr
dc.description.abstractUn réseau social est une structure dans laquelle des personnes sont liées les unes aux autres par le biais d’une relation ou d’un intérêt commun. Le processus d’investigation des réseaux sociaux se basant sur la théorie des graphe et des réseaux est appelée analyse des réseaux sociaux. Au cours de la dernière décennie, la modélisation et le forage des réseaux sociaux ont attiré de plus en plus l’attention. De nombreux chercheurs cherchent à révéler les schémas cachés et les évolutions de ces réseaux, pouvant saisir les interactions entre personnes et groupes de personnes. Dans notre recherche, nous nous sommes concentrés sur la recherche et l’analyse de l’évolution des communautés dans les réseaux sociaux dynamiques, qui est également connu comme le suivi des communautés au fil du temps. Pour ce faire, une stratégie de correspondance entre les communautés est élaborée, chaque communauté en évolution sera caractérisée par une série de communautés évolutives significatives. Dans le domaine de l’analyse des réseaux sociaux, la plupart des auteurs se concentrent uniquement sur la détection des changements (événements critiques comme la formation, l’expansion, la fusion, la scission, etc.) que les communautés peuvent subir. Et ils évaluent leurs algorithmes en regardant le nombre d’occurrences d’événements critiques pendant toute la période de suivi, se concentrent à peine sur le suivi de la communauté en elle-même. Plusieurs méthodes de suivi des communautés ont été proposées, dont la plupart utilisent une approche séquentielle pour effectuer une cartographie des communautés une-à-une, et les communautés sont comparées en termes de noeuds partagés à des instants consécutifs (principalement avec la mesure de similarité basée sur le coefficient Jaccard). De telles approches pourraient nous conduire dans une mauvaise direction pour le suivi des communautés car elles négligent les positions sociales des membres de la communauté et diminue les possibilités de trouver les évolutions potentielles. Pour pallier les limitations mentionnées ci-dessus, nous proposons un nouvel algorithme de suivi des communautés. Nous avons adopté un processus en deux étapes: premièrement, détecter de manière indépendante les communautés à chaque instant, puis effectuer des correspondances entre plusieurs communautés sur toute la période de suivi avec une nouvelle mesure de similarité pour générer une séquence représentant l’évolution de celles-ci. La mesure de similarité que nous proposons est capable non seulement de capturer numériquement la proportion des noeuds partagés (similarité du contenu), mais aussi d’évaluer l’importance de leurs noeuds communs (qualité des noeuds) et la proximité temporelle entre les communautés. Pour la stratégie de suivi, nous maximisons la similarité par paire sur toutes les correspondances sélectionnées, ce qui permet des correspondances plusieurs-à-plusieurs entre les communautés au cours des différents instants. La mise en correspondance est miss en oeuvre sur toute la période d’observation. Cela signifie que notre méthode sera capable d’optimiser les évolutions potentielles que nous pourrions trouver. Pour démontrer la capacité de l’approche proposée à augmenter la précision du suivi, nous avons réalisé des études expérimentales. Nous avons mené une étude comparative entre quatre approches existantes et notre approche proposée pour le suivi des communautés afin de clarifier leurs forces et leurs faiblesses. Dans notre analyse, nous comparons les algorithmes séparément dans deux ensembles de communautés principaux: (1) lorsque les groupes de personnes ne se chevauchent pas et (2) lorsque les groupes se chevauchent. Après extraction des communautés, nous implémentons les cinq approches avec la même configuration (y compris la même méthode de sélection des seuils de similarité et les mêmes critères d’évaluation) sur trois bancs d’essai différents, extraits des bases de données DBLP, Autonomous System (AS) et Yelp. Les communautés que nous pouvons suivre avec succès à partir de chaque approche peut nous mener à une conclusion: notre approche est suffisamment efficace pour capturer les évolutions des communautés au fil du temps et, en même temps, améliore remarquablement la précision du suivi.fr
dc.language.isoengfr
dc.publisherUniversité de Sherbrookefr
dc.rights© Ziwei Hefr
dc.rightsAttribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 2.5 Canada*
dc.rightsAttribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 2.5 Canada*
dc.rightsAttribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 2.5 Canada*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/2.5/ca/*
dc.subjectCommunity trackingfr
dc.subjectSimilarity measurefr
dc.subjectEvolving networksfr
dc.titleCommunity Tracking in Evolving Social Networksfr
dc.title.alternativeSuivi des Communautés dans les Réseaux Sociaux Dynamiquesfr
dc.typeMémoirefr
tme.degree.disciplineInformatiquefr
tme.degree.grantorFaculté des sciencesfr
tme.degree.levelMaîtrisefr
tme.degree.nameM. Sc.fr


Files in this document

Thumbnail
Thumbnail

This document appears in the following Collection(s)

Show simple document record

© Ziwei He
Except where otherwise noted, this document's license is described as © Ziwei He