<< Back

Questions pour un outil – Réponses et explications #36

Voici les réponses aux deux questions « Questions pour un outil » de la semaine du 20 au 26 septembre 2021.

Vous pouvez toujours y participer sur LinkedIn ou la communauté :

La question du mardi était :

En comparant le jeu de données et le résultat on constate ceci :

  • Les valeurs de la colonne Prénom sont regroupées et triées par ordre alphabétique
  • Pour une même valeur de la colonne Prénom, les valeurs de la colonne Ville sont regroupées et triées par ordre alphabétique inversé
  • Pour une même combinaison de valeurs des colonnes Prénom et Ville, les valeurs de la colonne Âge sont triées de la plus grande à la plus petite

Au vu des constatations, on déduit qu’il faut trier le jeu de données selon la colonne Prénom d’abord, puis la colonne Ville, puis la colonne Âge.

Dans l’outil Trier, il est possible d’utiliser autant de champs que disponibles dan le jeu de données. Et pour chacun des champs utilisés, on indique si le tri est Croissant ou Décroissant.

C’est l’ordre dans lequel sont configurés les champs dans l’outil Trier qui est important puisque ce sera le même lors de l’application du tri. Nous devons donc d’abord indiquer le champ Prénom avec un ordre de tri Croissant, puis le champ Ville avec un ordre de tri Décroissant et enfin le champ Âge avec un tri Décroissant.

La configuration finale est celle-ci :

Voici la documentation de l’outil pour plus d’informations : https://help.alteryx.com/fr/current/designer/sort-tool

La question du jeudi était :

En comparant le jeu de données et le résultat on constate ceci :

  • Les colonnes communes Marque et Modèle sont unies
  • Les colonnes Année et Couleur, présentes chacune dans un seul jeu de données en entrée, ne sont pas dans le résultat
  • Les lignes du premier jeu de données sont au-dessus des lignes du deuxième jeu de données

Pour commencer à configurer l’outil Union, il faut choisir le type d’union. Ici, les colonnes Marque et Modèle sont unies mais ne sont pas aux mêmes positions dans chacun des jeux de données en entrée. Ils ne sont donc pas unis par position mais par nom de colonne. On choisit donc l’option Configuration automatique par nom.

Pourquoi pas la configuration manuelle ? Par définition elle est utilisable dans tous les cas mais on privilégiera la configuration automatique lorsque c’est possible car c’est plus simple et cela permet d’éviter les erreurs humaines.

Ensuite, les colonnes présentes dans un seul des jeux de données d’entrée ne sont pas présentes dans le résultat. Et cela est dû à la partie Lorsque les champs diffèrent. Dans cette partie se trouvent deux options : que dire à l’utilisateur lorsque c’est le cas (rien, avertissement, erreur) et s’il faut ajouter les champs concernés dans le résultat. Dans notre cas peu importe la première option, c’est la deuxième qui est importante. Il faut choisir la valeur Sortir un sous-ensemble commun de champs pour ne sortir que les champs présents dans tous les jeux de données en entrée.

Enfin, il reste à gérer l’ordre des lignes dans le résultat. En fonction de l’ordre dans lequel les sources ont été connectées à l’outil Union, la configuration change.

Si vous avez connecté la première source (celle au-dessus dans le workflow) en premier, alors il n’y a rien à changer. En revanche si vous avez fait l’inverse, il faut cocher l’option Définir un ordre de sortie spécifique et placer la valeur #2 au dessus de la valeur #1. Ces valeurs sont celles des connexions entre les sources et l’outil Union. Par défaut, l’outil Union empile les données en fonction de l’ordre dans lequel vous lui connectez les sources.

La configuration finale est celle-ci :

Voici la documentation de l’outil pour plus d’informations : https://help.alteryx.com/fr/current/designer/union-tool

C’est tout pour cette semaine ! Rendez-vous la semaine prochaine pour deux nouvelles questions ! 🙂

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *