Au détour d’un projet, on se retrouve souvent confronté à des problématiques liées soit à des migrations de données, soit à un nettoyage de base, soit à de l’intégration par les données entre applications, soit encore à de l’extraction qualitative en vue d’un reporting de synthèse.
L’approche communément utilisée se traduit sous le vocable d’ETL (Extract Transform and Load). Cette approche repose schématiquement sur des connecteurs servant à importer ou exporter les données dans des bases ou des applications et à des transformations ou mapping permettant de les manipuler.
J’ai pu récemment utilisé la solution open source Talend Open Studio. Il s’agit d’un atelier graphique, sur une base Eclipse, permettant la construction de jobs. L’approche est très intuitive et la documentation de qualité. Le schéma ci-dessous illustre un exemple d’utilisation de l’atelier pour une problématique de nettoyage de données :
Très intéressant également, on peut choisir entre Perl et Java pour la génération des jobs, ce qui permet d’insérer des opérations directement dans ces langages dans les processus de transformation.
En bref, un produit à avoir sous le coude en toute circonstance !