<< Back

Améliorer la performance de vos workflows Alteryx

Comment améliorer la performance de vos workflows sur Alteryx Designer ? En fonction du type et de la quantité de données utilisées, le temps de traitement peut parfois être très long ! En effet, plus vos données sont volumineuses et plus le temps de réponse l’est aussi.

L’optimisation de vos workflow est un sujet crucial pour vous ? Je vous propose ici 10 astuces qui vont vous permettront d’améliorer la performance de vos workflows sur Alteryx Designer.

Optimiser vos workflows Alteryx en 10 astuces

Identifier le temps d’exécution de chaque outil

Sur le canva, vous avez la possibilité d’afficher le temps d’exécution du workflow en cochant afficher le profilage des performances.

Identification du temps d’exécution de vos workflows dans Alteryx Designer

La fenêtre des résultats indique le temps de de traitement  de chaque outil et celui du workflow. Vous êtes désormais en mesure d’identifier les outils les plus chronophages.

Sélectionner les colonnes utiles

Un moyen efficace d’améliorer le temps d’exécution de votre workflows est de sélectionner uniquement les colonnes sur lesquelles vous travaillez le plus tôt possible dans votre workflow. 

Sélection des colonnes dans Alteryx Designer

Définir le type de données associé à votre champ le plus tôt possible optimise également les performances votre workflow. Par exemple, les booléens et les champs numériques consomment moins de ressources que les chaînes de caractères. 

Utiliser l’outil « Champ automatique » (Auto-field)

Cette fonctionnalité permet de configurer l’outil ‘sélectionner’ et d’attribuer à vos champs une plus petite taille.

Attention, l’outil peut cependant être chronophage. Une fois vos données au bon format, je vous conseille de le retirer de votre workflow final.

Placer vos filtres le plus tôt possible dans votre workflow

N’attendez pas de construire tout votre workflow et de placer les filtres à la fin. En effet, moins vous avez de données à traiter en amont, plus le temps d’exécution s’améliore !

Prenons l’exemple d’un jeu de données avec plus de 30 millions de lignes. Le filtre, placé en début du workflow, permet l’exécution en 1:41 minutes ! En revanche,si vous le placez à la fin, le temps de chargement est de 1:52 minutes.

L’impact d’un filtre placé en début du workflow :

Workflow Alteryx Designer
Performance Workflow Alteryx Designer

L’impact d’un filtre placé en fin du workflow :

Workflow Alteryx Designer
Performance Workflows Alteryx Designer

Exporter vos données en .yxdb et les réutiliser en entrées de données 

Une autre méthode d’amélioration de la performance consiste à exporter votre fichier de données en une base .yxdb.

Placez ensuite après votre entrée de données un outil de sortie yxdb, puis le convertir en entrée de données.

Outil de sortie de données Alteryx Designer
outil de sortie de données Alteryx Designer

Le temps de réponse est plus rapide et est désormais de 39.9 secondes.

Workflows Alteryx Designer
Performance workflows Alteryx Designer

Activer/désactiver un conteneur

Dans l’exemple précédent, le fichier csv a été transformé en une base Alteryx .yxdb pour de meilleures performances. Je vais utiliser cette même base pour la construction du workflow.

Le passage du csv au yxdb n’est plus utile une fois que vous avez le fichier de sortie. Vous pouvez donc le placer dans un conteneur désactivé. Il n’est pas utilisé pendant l’exécution du workflow et vous pouvez ainsi gagner en rapidité !

Conteneur workflows alteryx designer pour optimiser la performance

Travailler avec un échantillon de données

L’outil échantillon (sample) est votre meilleur allié, car il limite l’entrée de vos données. N’hésitez pas à l’utiliser lors de vos phases tests. C’est ici un moyen rapide et efficace de contrôler une partie de vos résultats.

Execution du workflow en cache

La partie du workflow mis en cache (dans un bloc transparent sur le workflow) est placée dans un fichier temporaire. Le flux sera ainsi exécuté à partir du point où la mise en cache a été faite. 

Éviter les outils très consommateurs en ressources 

Le Data Cleansing est un exemple d’outil consommateur de ressources. Ce dernier est une macro permettant le nettoyage de données (retrait des espaces, remplacement des valeurs nulles …).

Par exemple, retirer les espaces d’un champ avec Data Cleansing donnera un temps d’exécution plus long que via une formule. 

Bonus : échanger entre utilisateurs !

Les utilisateurs Alteryx sont vos meilleurs alliés pour améliorer la performance de vos workflows ! Vous pouvez jeter un œil sur le forum de la communauté et découvrir les meilleures astuces des autres utilisateurs ! Également, vous pouvez aussi parcourir nos autres articles Alteryx sur notre blog !

Si vous souhaitez d’autres astuces ou conseils, n’hésitez pas à contacter notre équipe à l’adresse contact@theinformationlab.fr.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.