Accueil Tips & tricks Le Sankey Diagram avec R

Le Sankey Diagram avec R

sankey_nap

Le Sankey est une représentation graphique des flux, qui redevient de plus en plus utilisée après sa célèbre représentation de 1869 (wikipedia).

Le data management en amont de la représentation est en fait ce qui est le plus complexe. Le plus simple est de travailler ses données pour produire 3 variables (source, target et value), les fonctions du package dplyr permettent d’obtenir facilement un tel dataframe.

Ensuite je recommande de construire une table de référence pour indexer les nœuds et éventuellement ajouter des couleurs.

Pour terminer il suffit d’utiliser le package plotly et de construire le diagramme.

sankey_plot

Voici le code :

sankey_1

sankey_2

 

Charger d'autres articles liés
Charger d'autres écrits par healthdata
Charger d'autres écrits dans Tips & tricks

Laisser un commentaire

Consulter aussi

Chargement de données dans R à partir de Sharepoint

Sur des projets collaboratifs, il n’est pas rare d’utiliser des feuilles excel…