DBT [https://www.getdbt.com/] fait partie de ces outils qui peuvent faire gagner
beaucoup…
Lire la suite
5 min read
23 oct. 2020
Delta Lake [https://docs.delta.io/latest/index.html] apporte de nombreux
avantages aux projets…
Lire la suite
6 min read
12 oct. 2020
ClickHouse, abrégé CH, est une base de données distribuée orientée colonnes
(DBMS). Elle permet d’…
Lire la suite
11 min read
22 sept. 2020
Vous avez 5 minutes ? Venez découvrir les nouveautés de Snowflake annoncées le 2 juin 2020.…
Lire la suite
4 min read
20 juil. 2020
En mars 2019, la société américaine Prefect [https://www.prefect.io/] annonçait
la mise à…
Lire la suite
12 min read
08 juin 2020
Alors qu'on nous suggère de généraliser la surveillance électronique sous la forme d'une application #StopCovid, prenons du recul sur ces technologies soi-disant anonymisées.…
Lire la suite
9 min read
26 mai 2020
Les modèles de machine learning sont de plus en plus utilisés dans nos
applications car…
Lire la suite
8 min read
13 mai 2020
Introduction
Dans le cadre de mon travail sur Google Cloud Platform, j’ai eu la…
Lire la suite
8 min read
08 avr. 2020
Que ce soit pour effectuer un grand nombre d’insertions en base de données au…
Lire la suite
14 min read
06 avr. 2020
L’année 2020 est déjà bien entamée et la liste des bonnes résolutions est
peut-être…
Lire la suite
8 min read
03 avr. 2020
Matillion est un ELT
[http://blog.ippon.fr/2019/11/04/introduction-a-lelt-et-a-la-solution-matillion/] qui,
depuis 2015,…
Lire la suite
8 min read
10 mars 2020
Nous avons vu dans l’article précédent
[http://blog.ippon.fr/2020/02/24/de-limportance-du-format-de-donnees-theorie/…
Lire la suite
9 min read
02 mars 2020
Être Data Engineer c’est beaucoup de développement, mais ce n’est pas que ça…
Lire la suite
5 min read
24 févr. 2020
Introduction
Dans le cadre d’une mission, j’ai eu l'opportunité d'…
Lire la suite
6 min read
17 févr. 2020
Koalas est une librairie open source développée par Databricks annoncée en mars 2019. Elle implémente les API Pandas pour Apache Spark. Elle unifie les API Pandas et Spark afin de rendre efficace Pandas dans la jungle du Big Data.…
Lire la suite
8 min read
03 févr. 2020