Pour commencer, il faut installer la bibliothĂšque PySankey sur notre notebook Google Colab :

Ensuite nous allons importer nos données dans le disque dur virtuel de notre notebook Google Colab :

Nous choisissons le fichier PAR_ORIGINES.XLSX :

Une fois installĂ© sur notre disque dur virtuel, nous allons copier le chemin d’accĂšs Ă  notre fichier sur le disque dur virtuel car nous l’utiliserons ultĂ©rieurement pour y accĂ©der lors de la crĂ©ation de notre jeu de donnĂ©es :

Avant de crĂ©er notre variable (objet) contenant nos donnĂ©es, nous importons la bibliothĂšque PANDAS en lui donnant l’alias PD. Nous appellerons DATA notre variable (objet) contenant nos donnĂ©es. Nous prĂ©cisons ici l’emplacement de nos donnĂ©es en copiant le chemin d’accĂšs Ă  nos donnĂ©es :

Le contenu des donnĂ©es peut ĂȘtre affichĂ© en appelant l’objet DATA

Le Sankey

Pour dessiner notre sankey, nous allons utiliser la bibliothĂšque PySankey. Vous pouvez accĂ©der aux dĂ©tails de cette bibliothĂšque PySankey en utilisant le lien suivant : https://github.com/anazalea/pySankey. Vous trouverez aussi des exemples d’utilisation en cherchant sur Google : https://www.python-graph-gallery.com/basic-sankey-diagram-with-pysankey

AprĂšs avoir importĂ© la bibliothĂšque PySankey et avoir choisi l’importation de sankey, nous crĂ©ons notre graphique en prĂ©cisant l’origine des donnĂ©es se situant Ă  gauche, Ă  droite, les poids des donnĂ©es ainsi que des dĂ©tails de style d’affichage.

Installer PySankey :

!pip install PySankey

Afficher le Sankey :

from pySankey.sankey import sankey

import pandas as pd

# Load the data from the Excel file
data = pd.read_excel('/content/par_origines.xlsx')
sankey(left=data['org'],right=data['dest'],leftWeight=data['volume'],rightWeight=data['volume'],aspect=20,fontsize=14)

Vous remarquerez que ce graphique est difficilement lisible. Il faudrait ici sélectionner des données plus spécifiques pour que le graphique devienne lisible.

Les donnĂ©es Ă©tant issues d’un DataFrame Pandas, lisez la documentation pandas pour la sĂ©lection des donnĂ©es : https://pandas.pydata.org/

Voir ici comment sĂ©lectionner les lignes d’un DataFrame Pandas : http://www.python-simple.com/python-pandas/dataframes-indexation.php

Exemple de code :

https://github.com/probablyvivek/30-Days-30-Charts-Challenge/blob/main/sankey.ipynb