
Pareto – Pour quelle valeur atteint-on les 80% ?
Pour ceux qui ne savent pas ce qu’est un diagramme de Pareto, en voilà quelques exemples :
Si vous entrez ‘Pareto’ dans Google image…
Pour ce post, j’utilise la base ‘World Indicators’ fournie dans les sources de données Tableau. Je souhaite représenter les différents pays ([Country]) en fonction de leur PIB ([GDP]).
Un diagramme de Pareto nous permet de voir avec combien de pays on peut atteindre 60%, 80% … du PIB mondial.
On peut aussi représenter les vents par clients, pour savoir quelle proportion de nos meilleurs clients suffit pour réaliser 80% du chiffre.
Au niveau IT, on pourrait regarder combien d’utilisateurs utilisent à eux seuls 50% des ressources.
Bref, il y a beaucoup d’applications à ce genre de graphique !
Un diagramme de Pareto tel que les précédents s’obtient facilement avec Tableau
Il faut utiliser les calculs de tables et une vue avec Axe double.
Dans le cas précédent, j’ai commencé par afficher le PIB de chaque pays. J’ai ensuite trié les pays par ordre décroissant du PIB.
C’est ce qui nous permet d’obtenir les barres bleues.
La courbe Orange s’obtient en dupliquant la mesure (SUM([GDP])) et en appliquant un calcul de table.
Nous souhaitons voir la somme cumulée, mais en pourcent du total.
Il faut donc ici utiliser l’option ‘ajouter un calcul secondaire’ en bas de la fenêtre du premier calcul de table.
Attention à bien vérifier également que les deux calculs sont bien faits par rapport à la dimension utilisée dans la vue (ici [Country]).
Le reste est simplement de la mise en forme : – Passer en Axe double
– Choisir un type de repère ‘Ligne’ pour le calcul de table
– Choisir un type de repère ‘Barres’ pour la mesure
– Choisir les couleurs
– Colorer les axes en rapport avec la couleur de la mesure correspondante
– Enfin, il est possible d’ajouter une ligne de référence à 80% (sur l’axe du calcul de table)
Ce qui nous permet d’avoir une idée du pays à partir duquel on a dépassé 80% du total.
Ce premier graphique est déjà intéressant. Mais plutôt que d’avoir une barre par pays, nous pourrions nous intéresser au nombre de pays (en % du total à nouveau) qui nous permettent d’atteindre 80%.
Ici, nous pouvons dire : A partir de la Suisse, on a dépassé les 80% du PIB mondial. Soit…
On peut afficher le rang global de chaque pays
Ce qui nous permet de dire qu’avec 18 pays, on dépasse 80% du PIB mondial. C’est un peu mieux, mais il manque encore l’information : 18, mais sur combien ?
D’où l’intérêt d’une seconde vue, qui représente la dimension également comme % du total cumulé.
Pour cela, il y a trois étapes :
– Glisser une seconde instance de la dimension [Country] sur le niveau de détail
– Changer la dimension [Country] dans les Colonnes pour utiliser une mesure Total(Distinct)
– Appliquer le même calcul de table que celui appliqué sur le PIB
A nouveau, il faut s’assurer que la dimension [Country] est bien cochée pour les deux calculs de table.
Encore une fois, le reste n’est que mise en forme.
On peut voir qu’en abscise nous avons maintenant bien un % du total, et non plus les différents pays.
C’est une façon de mettre en évidence la fameuse ‘loi des 80-20’ : 20 % des pays permettent d’atteindre 80% du PIB.
En réalité, cette loi n’est vérifiée que si la distribution suit une loi de Pareto avec comme indice log(5)/log(4)). Ces valeurs 80-20 sont donc principalement historiques. Le principe a notamment été repris pour l’analyse de l’efficacité au travail (20% du travail permet de produire 80% du résultat).
Cependant, comme on peut le voir sur le graphique précédent, on ne retombe pas toujours sur 20% !
Dans notre exemple ici, nous sommes plus aux alentours de 10%.
Comment récupérer la valeur exacte ici ?
C’est ce que nous allons voir ….
Tout d’abord, nous devons récupérer la valeur seuil : le premier point de la courbe qui est au-dessus de 80%.
Nous pouvons donc créer un champs calculé ‘Seuil’ qui vas simplement détecter cette valeur.
Soit quand le calcul de table devient supérieur ou égal à 80%
Le calcul est le suivant
Vous pouvez simplement faire du Drag and Drop pour utiliser votre calcul de table
Lorsque vous placez cette fonction, attention de bien vérifier que le calcul de table est toujours bien réalisé par rapport à la dimension [Country].
Voila à quoi ressemble notre fonction seuil !
C’est un début. Mais ici, nous voulons uniquement la valeur minimale. Comme il s’agit d’une mesure déjà agrégée, nous ne pouvons pas simplement choisir la mesure MIN().
Nous allons donc utiliser à nouveau les calculs de table
Nous récupérons ici à valeur pour laquelle la fonction seuil est égale à son minimum !
Attention, il y a plusieurs calculs de table imbriqués.
Attention à bien vérifier qu’ils sont tous effectués par rapport à la dimension [Country]
Un axe double avec une barre très fine pour le nouveau calcul nous permet d’obtenir la vue suivante :
N’oubliez pas de synchroniser les axes !
Cette vue nous permet de situer la valeur. Il reste toutefois à avoir la valeur exacte, que nous pourrons afficher en infobulle ou en étiquette !
Pour cela, il nous suffit de dupliquer le calcul précédent en le modifiant légèrement. Lorsque la valeur seuil est égale à son minimum, nous ne voulons plus le calcul de table affiché dans les Lignes, mais celui affiché dans les colonnes !
Voilà le calcul :
Il s’agit toujours d’un calcul imbriqué, à bien effectué par rapport à la dimension [Country].
Et voilà !
Dans notre cas, on atteint 80% du PB mondial avec moins de 8.7% des pays !