2017-12-08
last modified: 2023-05-15
== !
Un réseau est un ensemble de données constitué d’entités et de leurs relations
Les scientifiques utilisent le terme "graphe" pour parler des réseaux.
En tant qu’utilisateurs, nous connaissons très bien un type de réseaux - les réseaux sociaux :
Il est important de réaliser que les réseaux couvrent plus que les relations entre humains. Par exemple, il est possible d’imaginer un réseau constitué de recettes de cuisine. 2 ingrédients sont liés s’ils apparaissent fréquemment dans les mêmes recettes.
En scannant toutes les recettes et leurs ingrédients depuis un site de recettes de cuisine, cela donne :
Les réseaux sémantiques sont une autre grande catégorie de réseaux. La méthode est la même : il faut trouver un moyen de « relier » les mots dans un texte, puis on obtient un réseau.
L’idée générale est la même que dans les recettes de cuisine : 2 termes d’un texte seront connectés dans le réseau s’ils apparaissent fréquemment dans les mêmes paragraphes.
Par exemple, “The Anatomy of the Facebook Social Graph” (2011)
→ étude de 721 millions d’utilisateurs Facebook actifs et des 69 milliards (!) de liens d’amitié qui les relient.
Une limite est vite atteinte en termes de visualisation : il est difficile de faire tenir des millions de nœuds sur un écran. Dans la visualisation suivante, nous pouvons voir un réseau de 90 000 suédophones et leurs relations sur Twitter. La vue est très encombrée.
(ouvrir la source pour une version interactive)
Si un réseau est constitué d’entités et de leurs relations, alors un segment est un sous-groupe d’entités du réseau, qui a une certaine cohésion ou quelque chose en commun.
Ce sous-groupe de nœuds du réseau est souvent appelé une « communauté ».
La détection de communautés dans un réseau, aussi appelée "clustering", consiste à trouver des nœuds qui ont de nombreuses connexions en commun.
Il s’agit d’une procédure mathématique et algorithmique, mais elle est très simple à comprendre visuellement :
Une société de science des données a créé "Où va mon tweet", qui retrace la propagation d’un tweet donné à travers les retweets.
Le service est désormais discontinué mais le mécanisme s’explique :
Dans la vidéo suivante, on voit les les banques participant aux prêts inter bancaires en Europe.
2 banques sont connectées si l’une prête à l’autre. Le schéma des échanges évolue au fil des ans - les banques se retirent du marché.
Autre exemple : connecter des mesures de performances commerciales apparemment sans rapport avec Oracle BI et Linkurious :
Vous pouvez aussi visiter mes tutos sur Gephi, le logiciel leader pour visualiser de grands graphes :
Trouvez des références pour cette leçon, et d’autres leçons, ici.
Ce cours est réalisé par Clément Levallois.
Découvrez mes autres formations en data/tech for business : https://www.clementlevallois.net
Ou contactez-moi via Twitter : @seinecle