A primer on network analysis for business

2017-12-08

last modified: 2023-05-15

== !

EMLyon logo corp

   

1. Définitions

Un réseau est un ensemble de données constitué d’entités et de leurs relations

Les scientifiques utilisent le terme "graphe" pour parler des réseaux.

network 1
Figure 1. Ceci est un réseau

   

a. Réseaux sociaux

En tant qu’utilisateurs, nous connaissons très bien un type de réseaux - les réseaux sociaux :

facebook twitter weibo instagram snapchat wechat linkedin

   

b. Autres réseaux

Il est important de réaliser que les réseaux couvrent plus que les relations entre humains. Par exemple, il est possible d’imaginer un réseau constitué de recettes de cuisine. 2 ingrédients sont liés s’ils apparaissent fréquemment dans les mêmes recettes.

En scannant toutes les recettes et leurs ingrédients depuis un site de recettes de cuisine, cela donne :

   

Les réseaux sémantiques sont une autre grande catégorie de réseaux. La méthode est la même : il faut trouver un moyen de « relier » les mots dans un texte, puis on obtient un réseau.

L’idée générale est la même que dans les recettes de cuisine : 2 termes d’un texte seront connectés dans le réseau s’ils apparaissent fréquemment dans les mêmes paragraphes.

   

c. Quelle peut être la taille des réseaux ?

Avec une augmentation de la puissance de calcul à l’ère du big data et des bases de données NOSQL adéquates (telles que Neo4J ou OrientDB), nous pouvons faire face à d’énormes réseaux:

→ étude de 721 millions d’utilisateurs Facebook actifs et des 69 milliards (!) de liens d’amitié qui les relient.

Une limite est vite atteinte en termes de visualisation : il est difficile de faire tenir des millions de nœuds sur un écran. Dans la visualisation suivante, nous pouvons voir un réseau de 90 000 suédophones et leurs relations sur Twitter. La vue est très encombrée.

(ouvrir la source pour une version interactive)

   

d. Comment discuter des réseaux ? Un peu de vocabulaire

Terminology
Figure 6. Terminology

   

2. Réseaux : pour quelle utilisation ?

a. Segmentation et catégorisation

Si un réseau est constitué d’entités et de leurs relations, alors un segment est un sous-groupe d’entités du réseau, qui a une certaine cohésion ou quelque chose en commun.

Ce sous-groupe de nœuds du réseau est souvent appelé une « communauté ».

La détection de communautés dans un réseau, aussi appelée "clustering", consiste à trouver des nœuds qui ont de nombreuses connexions en commun.

Il s’agit d’une procédure mathématique et algorithmique, mais elle est très simple à comprendre visuellement :

segmentation with community detection in networks
Figure 7. segmentation with community detection in networks

   

b. Trouver des acteurs clés

Key players visualized by resizing nodes
Figure 8. Key players visualized by resizing nodes

   

c. comprendre comment l’information se propage

Une société de science des données a créé "Où va mon tweet", qui retrace la propagation d’un tweet donné à travers les retweets.

Le service est désormais discontinué mais le mécanisme s’explique :

Where Does my Tweet Go by MFGLabs
Figure 9. Where Does my Tweet Go by MFGLabs

   

d. Identification des modèles - pour la détection, le contrôle ou le renseignement des fraudes.

2 banques sont connectées si l’une prête à l’autre. Le schéma des échanges évolue au fil des ans - les banques se retirent du marché.

   

Autre exemple : connecter des mesures de performances commerciales apparemment sans rapport avec Oracle BI et Linkurious :

   

3. Pour aller plus loin

golbeck nodexl newman barabasi

Vous pouvez aussi visiter mes tutos sur Gephi, le logiciel leader pour visualiser de grands graphes :

Contact

Trouvez des références pour cette leçon, et d’autres leçons, ici.

round portrait mini 150

Ce cours est réalisé par Clément Levallois.

Découvrez mes autres formations en data/tech for business : https://www.clementlevallois.net

Ou contactez-moi via Twitter : @seinecle

site
    stats