<< Back

L’outil « Jointure » dans Alteryx Designer

This article was originally posted by under the article on the website

Qu’est-ce que l’outil Jointure dans Alteryx Designer ? À quoi sert-il et comment l’utiliser en tant qu’analyste ? Nous allons commencer par les bases via la compréhension du diagramme de Venn. Ensuite, nous entrerons dans les détails, toujours sous le ton de l’humour et de répliques cultes de films connus !

Comment fonctionne une jointure ?

Le diagramme de Venn

Si vous avez des notions en statistique, je suis sûr que vous avez déjà rencontré cette image avec deux cercles (nommés respectivement A et B) avec une partie commune aux deux cercles (nommées A∩B).
Vous pouvez lire A et B pour plus de facilité.

Diagramme de Venn,

Imaginez que ces cercles représentent une base de données : chaque donnée possède son propre emplacement. Si une donnée est propre à la base de donnée A, alors elle sera en dehors de la partie commune, mais si celle-ci est commune, elle sera à l’intérieur. C’est ce que nous recherchons car c’est ce qui permet d’avoir les clés pour créer une jointure.

Maintenant, je vais remplacer A et B par deux bases de données distinctes. Le cercle A est remplacé par la base de donnée « Expression de films ». Le cercle B par « Les noms de films ».

Si je reprends le diagramme de Venn, voici où je vais positionner mes données avec un code couleur permettant de simplifier la lecture :

Jointures et Diagramme de Venn

On comprend que les dates correspondent aux deux bases de données « Expressions de films » et « Noms de films ». Nous pouvons donc utiliser ce champs pour faire notre jointure.

Tout va bien jusqu’ici ? Vous trouverez des ressources en fin d’article, n’hésitez pas à lire jusqu’à la fin.

Comment faire une jointure sur Alteryx Designer ?

Nous allons utiliser l’outil « Jointure » que vous pourrez retrouver endroit :

La jointure contient 2 encres en « input », ceci va être très utile pour joindre nos deux bases de données.

Voilà ce qui apparaît à la gauche de l’écran. Il existe beaucoup d’informations, mais concentrons-nous sur la partie Joindre par champ spécifique.

Juste en dessous, il y a « Joindre par champ spécifique » avec Gauche et Droite qui apparaît encore en dessous. Alteryx Designer nous demande de désigner les colonnes nécessaires pour joindre les bases de données « Expression de films » et « Noms de films ». Ici, le champ « Année » a été choisie, car ce sont les données qui correspondent aux deux tableaux.

Les différents types de jointures

Nous allons pouvoir reprendre le principe du diagramme de Venn vu plus haut !

  • Si vous ne voulez que les données des expressions de films, vous allez choisir le premier (L)
  • Si vous voulez les données qui correspondent entre les deux tableaux, l’entre deux (J)
  • Si vous ne souhaitez que les noms de films, vous choisissez (R).

Vous pouvez consulter ces résultats en cliquant sur les trois ancres à la droite de l’outil. De haut en bas, on retrouve Jointure gauche (L), Interne (J) et droite (R).

Jointure interne (J)
Jointure gauche (G)
Jointure droite (D)

Les résultats sont les mêmes que lorsque je vous ai présenté les bases de données avec les diagrammes de Venn. Vous devriez avoir une question en tête : à quoi cela sert de Joindre par position d’enregistrement ? Ceci est une bonne question, voici une image avec le résultat juste en dessous :

Les problèmes rencontrés avec l’outil « Jointure »

Vous ne remarquez pas quelque chose de bizarre ? Je vous invite à reprendre le résultat lorsque j’ai fait le lien avec Année et celle-ci. Le résultat est étrange puisque nous voyons que Kaamelott fait une réplique de James Bond.

En effet, Alteryx Designer prend en compte l’emplacement des données. Par exemple, la réplique de James Bond est à la 6ᵉ position, de la même façon, Kaamelott est le 6ᵉ film dans « Noms de films ».

Il faut donc bien s’assurer que la position des données soit exact si vous le faites de cette manière. Dans le cas contraire, je vous invite à utiliser une colonne en relation avec les deux bases de données. Maintenant que vous êtes devenu un expert de la jointure, il est temps de vous révéler une astuce !

Jointure et outil « Union » dans Alteryx

Il est impossible d’avoir une jointure des expressions des films avec les données en relation dans « Noms de films ». Nous pouvons résoudre ce problème en ajoutant un nouvel outil à notre workflow Alteryx Designer : « Union ».

Il suffit d’ajouter une union après la jointure. Ainsi, nous pouvons relier la première ancre à gauche pour relier toutes les expressions de films avec la deuxième. De cette manière, nous avons une jointure qui possède toutes les expressions de films, ainsi que les noms de films. Comme on le dit si bien dans « Le Dîner de cons » : « Ça, c’est très tordu, mais bougrement intelligent. »

N’hésitez pas à aller plus loin et améliorer votre compréhension de l’outil « Jointure » dans Alteryx Designer

Besoin d’aide avec Alteryx ?

Vous êtes curieux de savoir comment Alteryx peut s’intégrer dans votre pratique de l’analyse ? Où déjà utilisateur et vous cherchez à progresser davantage ? Ou bien, un utilisateur débutant et vous souhaitez vous former ?

Notre équipe se fera une joie d’en discuter avec vous ! Faites-nous part de vos besoins en nous contactant à contact@theinformationlab.fr !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.