Data

Total 207 Posts

DBT [https://www.getdbt.com/] fait partie de ces outils qui peuvent faire gagner beaucoup…
Lire la suite


5 min read

23 oct. 2020

Delta Lake [https://docs.delta.io/latest/index.html] apporte de nombreux avantages aux projets…
Lire la suite


6 min read

12 oct. 2020

ClickHouse, abrégé CH, est une base de données distribuée orientée colonnes (DBMS). Elle permet d’…
Lire la suite


11 min read

22 sept. 2020

Vous avez 5 minutes ? Venez découvrir les nouveautés de Snowflake annoncées le 2 juin 2020.…
Lire la suite


4 min read

20 juil. 2020

En mars 2019, la société américaine Prefect [https://www.prefect.io/] annonçait la mise à…
Lire la suite


12 min read

08 juin 2020

Alors qu'on nous suggère de généraliser la surveillance électronique sous la forme d'une application #StopCovid, prenons du recul sur ces technologies soi-disant anonymisées.…
Lire la suite


9 min read

26 mai 2020

Les modèles de machine learning sont de plus en plus utilisés dans nos applications car…
Lire la suite


8 min read

13 mai 2020

Introduction Dans le cadre de mon travail sur Google Cloud Platform, j’ai eu la…
Lire la suite


8 min read

08 avr. 2020

Que ce soit pour effectuer un grand nombre d’insertions en base de données au…
Lire la suite


14 min read

06 avr. 2020

L’année 2020 est déjà bien entamée et la liste des bonnes résolutions est peut-être…
Lire la suite


8 min read

03 avr. 2020

Matillion est un ELT [http://blog.ippon.fr/2019/11/04/introduction-a-lelt-et-a-la-solution-matillion/] qui, depuis 2015,…
Lire la suite


8 min read

10 mars 2020

Nous avons vu dans l’article précédent [http://blog.ippon.fr/2020/02/24/de-limportance-du-format-de-donnees-theorie/…
Lire la suite


9 min read

02 mars 2020

Être Data Engineer c’est beaucoup de développement, mais ce n’est pas que ça…
Lire la suite


5 min read

24 févr. 2020

Introduction Dans le cadre d’une mission, j’ai eu l'opportunité d'…
Lire la suite


6 min read

17 févr. 2020

Koalas est une librairie open source développée par Databricks annoncée en mars 2019. Elle implémente les API Pandas pour Apache Spark. Elle unifie les API Pandas et Spark afin de rendre efficace Pandas dans la jungle du Big Data.…
Lire la suite


8 min read

03 févr. 2020