<< Back

Tableau Data Management et Server Management – qu’est-ce que c’est ?

La Conférence Tableau 2019 a été une occasion pour moi de mieux comprendre les offres Tableau Data Management et Tableau Server Management ainsi que de découvrir les nombreuses fonctionnalités qui les accompagnent.

Ces offres se construisent et se développent à vitesse grand V. Ce sont de véritables outils de gouvernance de la donnée et des process que Tableau propose.

Je voudrais donc reprendre ici certains outils auxquels ces add-ons du serveur donnent accès.

Tableau Prep Conductor

C’est l’outil phare de l’offre Data Management. Il permet de programmer des flux construits avec Tableau Prep Builder. Il permet également de s’abonner afin d’être tenu informé de l’exécution d’un flux.

Cela se fait dans un contexte où Tableau Prep se développe lui-même très rapidement. D’ici un an, Tableau annonce que Prep sera 100% disponible sur l’interface Web : les mêmes fonctionnalités que le client lourd actuel, mais en ligne, disponibles n’importe où et à tout moment.

Il sera possible d’exécuter des rafraîchissements incrémentaux pour éviter de traiter plusieurs fois la même donnée.

Il est déjà possible d’appeler du code R, Python ou MATLAB dans Prep, tout comme dans Tableau Desktop.

Demain, Prep pourra également aider l’utilisateur à construire des calculs complexes tels que des LOD avec une fenêtre d’assistance à la création (choix d’un Group By, choix de la mesure…) ou bien les calculs de tables, avec le Rang bientôt disponible.

Enfin, Prep va nous permettre de réutiliser des parties de workflows.
Il sera possible de sauvegarder une liste d’étapes en un seul « outil » et de le réimporter dans d’autres flows. Mais surtout, il sera possible de le publier sur le serveur, et donc de le partager au sein d’une équipe ou de l’entreprise.

Le magasin de métadonnées

Une autre offre de l’add-on Data Management : Tableau Catalog. Comme son nom l’indique, il s’agit d’un catalogue de la donnée.

Il devient une référence pour comprendre l‘origine et la destination de vos données : à partir d’un champ, il est possible de retrouver d’où il vient (base de données), comment il est transformé (Tableau Prep, formules appliquées) , dans quels classeurs/vues il est utilisé et par Qui !

Avec toutes ces informations à portée de main, à travers ce que Tableau appelle le Lineage, il devient facile de connaître l’impact de la transformation éventuelle d’un champ, et de prévenir les personnes concernées.

Il devient également facile de savoir quelles tables sont les plus utilisées, quels champs, quelles formules sont communément appliquées sur ces champs (et envisager de les ajouter aux bases certifiées ? ). Bref, cet outil permet une réelle Gouvernance de la donnée au sein de l’entreprise.

A partir d’un classeur, un simple bouton permet, en ligne, d’investiguer les champs utilisés sur ce classeur.

Des informations riches sur ces champs apparaissent sur un volet à droite.


De plus, Catalog ne se limite pas à la donnée Tableau. Il sera possible d’importer et d’exporter des informations sur les métadonnées depuis d’autres services similaires partenaires de l’outil.
Tableau a annoncé lors de la TC 19 que de nombreuses entreprises sont déjà partenaires : Alteryx, Informatica, Alation, Collibra et Google Cloud. Leurs outils seront donc compatibles.

Le ressource Monitoring Tool

Il existe aujourd’hui plusieurs outils supportés par la communauté qui aident à monitorer les ressources disponibles sur Tableau Serveur.
On peut citer principalement TabMon (pour la ressource de type Mémoire, CPU, …). Il en existe d’autres tels que LumberSnake, LogShark, TabJolt …

Avec l’offre Server Management, Tableau proposera un outil intégré et connecté en direct à vos serveurs Tableau. Il permet de monitorer les ressources disponibles sur le Serveur…

… affichant des informations précises sur les performances et l’usage du serveur en général…

… et allant jusqu’au détail des sessions avec la possibilité de descendre dans les événements pour identifier les possibles causes dune anomalie.

Pour ceux qui ont déjà utilisé TabMon, vous savez que l’exploitation des résultats se fait en différé. Le Ressource Monitoring Tool propose une analyse en temps réel. Il peut être vu comme un équivalent des vues administratives qui permettent de monitorer l’usage du serveur (en terme d’utilisateurs, de visites, de nombre de publications…).

Le Content Migration Tool

Un autre outil très utile qui est accessible à travers l’offre Server Management est l’outil de migration.

Le Content Migration Tool, que j’ai pu tester à une session dédiée lors de la conférence, est extrêmement complet et permet de migrer du contenu simplement, de façon industrialisée et en quelques clics !

Il est déjà disponible depuis la version 2019.3 du serveur !

Cet outil est très riche, il permet de définir un plan de migration.
Par exemple migrer tout le contenu du projet « Sandbox » qui est tagué comme « Approuvé » vers un projet « Prod ».

Il permet également de migrer du contenu d’un site vers un autre, ou d’un serveur vers un autre.

Mais plus impressionnant, il permet également d’effectuer au passage certaines transformations : supprimer les tags, changer les permissions sur la donnée, modifier la source de données, renommer, ajouter des filtres, modifier des images…

Que ce soit sur les classeurs…

…ou sur les sources de données

De plus, un plan peut être sauvegardé et programmé ! Vous pouvez donc automatiser la vérification et l’exécution de migrations de Dev vers Prod, à condition d’avoir défini bien sûr les bonnes règles !

L’utilisation des Tags par exemple est ici utile. Si vous ajoutez les Tags sur les workbooks prêts, Tableau vérifiera lui-même le critère et exécutera le plan de migration à chaque fois que nécessaire.

Et voilà, la migration se fait toute seule, avec la possibilité de monitorer ce qu’il se passe et de consulter des logs pour corriger le plan en cas de problème.

La metadata API

La metadata API ne demande pas d’avoir Data Management et Tableau Catalog pour pouvoir être utilisée, mais sa mise à disposition fait suite au développement du catalogue. C’est notamment grâce à cette API qu’il est possible d’échanger des métadonnées avec des services externes (tels qu’Alteryx, Informatica, ou Google Cloud).

Mais que sont les métadonnées sur mon serveur ?

Le schéma ci-dessous reprends les contenus concernés qui enrichissent les métadonnées que Tableau Catalog, notamment, consomme.

Data Management n’est pas nécessaire, mais le fait de l’avoir débloque certaines fonctionnalités qui accompagnent l’API. Ainsi il n’est possible de l’utiliser qu’en lecture sans l’add-on, alors que Data Management permet de l’utiliser en écriture et de pousser des métadonnées sur le serveur ainsi que des alertes ou des certifications….

Elle est déjà disponible depuis la version 2019.3 !

Cette API, une API GraphQL, permet donc d’exporter tout un tas d’informations de façon automatique. Accompagnée des autres API, elle vous permettra d’automatiser à votre convenance des traitements sur les données.

Les cas d’usage sont nombreux

Un exemple de requête récupérant les sources publiées :

Des problèmes de performance ?

Il sera facile de récupérer les tables avec de nombreuses colonnes

Un audit sur les formules pourrait être intéressant…Mais le travail d’extraction de l’ensemble des formules sur l’ensemble des classeurs semble fastidieux…. Plus maintenant ! cela pourra être fait en une seule requête !

L’API permet de récupérer l’ensemble des calculs utilisés sur les workbooks en production sur votre Serveur.

Ainsi que les classeurs utilisant ces calculs


De la même façon, il sera possible d’extraire les calculs ad-hocs, les calculs trop peu utilisés, les classeurs utilisant des requêtes personnalisées en SQL…

What Now ?

Si comme moi vous ignoriez tous ces usages qui sont devenus possibles avec l’apparition de ces add-ons, c’est le moment d’évaluer et de tester ces solutions !
Si vous souhaitez en savoir plus, je vous invite à visiter les page d’aide en ligne de Tableau pour Server Management et pour Data Management, qui en recensent les usages ou bien à nous contacter directement.

Pour tester ces offres, vous pouvez visiter les pages suivantes:

Server Management

Data Management

Elsa Mullor

Paris

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *