
J’ai testé pour vous Engine.next !
Tout juste sorti de la conférence annuelle d’Alteryx (Inspire 2019), j’ai écrit un post LinkedIn sur l’annonce des performances du nouveau moteur d’Alteryx Designer : Engine.next.
Puis, j’ai eu envie de vérifier les chiffres annoncés…
Direction la plateforme BETA d’Alteryx, download de l’exe, installation, et c’est parti !
De vrais améliorations !
J’ai réalisé les tests sur mon PC portable qui date de 2017 (Intel Core I7 – 2,6Ghz – 16Go RAM – SSD).
J’ai utilisé des workflow déjà existants créés pour des démos client ou des « Proof of concept ».
Qu’on se le dise tout de suite, la jointure est un outil qui bénéficie énormément d’Engine.next !
Sur mon PC, un workflow très simple qui réalise essentiellement une jointure entre
– un fichier d’1 million de lignes
et
– un autre de 10.000 lignes
produisait 125 millions de lignes en 90s (ce qui était franchement déjà pas mal, avouez le !)
Avec Engine.next, ça ne prend plus que 13s soit 7 fois plus rapide !!!
Passé ce test « brut » peu représentatif, j’ai testé ensuite sur quelques workflow maison :
- Parsing d’un très gros fichier JSON (380Mo – Transpose / Formula / Sort) :
–> Je passe de 34s à 21s (-30%)
- Validation de données (Transpose d’1 millions de lignes / formules sur 13 millions de lignes) :
–> de 108s à 27s (-75% -> 4 fois plus rapide !)
- Lecture de multiples fichiers CSV (14 fichiers, 3,4 millions de lignes au total), dédoublonnage, text to column, formule sur 1M de lignes, jointure :
–> de 43s à 15s (-60% -> 3 fois plus rapide)
- Workflow à dominante reporting :
–> de 3,7s à 2,5s (-30%)
Moi qui trouvait déjà Alteryx rapide, j’avoue me faire encore surprendre !
On peut donc dire que les chiffres montrés pendant la conférence ne sont pas des promesses en l’air et qu’ils correspondent bien à la réalité !
Il faudrait cependant les confronter à des workflow plus longs, je vous l’accorde. Je manque de matière sur mon PC pour l’appliquer à d’autres cas réels.
… mais encore quelques bugs
Cette nouvelle mouture m’a tout de même causé quelques mauvaises surprises.
En vrac :
- Bug lors de l’enregistrement au format Tableau Hyper
- On ne peut plus faire une jointure entre un double et un Int, obligé d’avoir 2 doubles ou 2 Int.
- Lire les 10 premières lignes d’un fichier d’1 millions de lignes prends 10s (contre 0,2s sur l’ancienne version du moteur) -> On dirait qu’Alteryx parcoure tout de même tout le fichier pour ne garder que 10 lignes.
Bon, il n’y a rien de grave, et c’est à ça que sert une phase BETA vous me direz. Je fais confiance aux développeurs pour corriger ça rapidement 🙂
Et c’est pour quand ?
Eh bien ! On ne sait pas ! Et ceci pour 2 raisons :
- Alteryx prend le temps nécessaire pour sortir un moteur exempt de tout bug. Il y a des centaines de milliers de workflow (des millions ?) qui tournent à travers le monde basés sur le moteur actuel. Alteryx ne prendra aucun risque le jour où ils décideront de la mise en production d’Engine.next.
- Il reste encore de nombreux outils à réécrire. J’ai entendu dire que 60 ont déjà été réécrits (sur plus de 250 au total). Il y a donc encore pas mal de boulot à abattre.
En tous les cas, tout ça me rend plutôt impatient ! J’ai hâte de confronter Engine.next à la réalité du terrain !
Et vous, qu’est-ce que ça vous « Inspire » ?
(Finir sur un jeu de mots moisi, c’est moche… désolé !)