Data

Total 116 Posts

ClickHouse, abrégé CH, est une base de données distribuée orientée colonnes (DBMS). Elle permet d’…
Lire la suite


11 min read

22 Sep 2020

Vous avez 5 minutes ? Venez découvrir les nouveautés de Snowflake annoncées le 2 juin 2020.…
Lire la suite


4 min read

20 Jul 2020

En mars 2019, la société américaine Prefect annonçait la mise à disposition en open source…
Lire la suite


12 min read

08 Jun 2020

Alors qu'on nous suggère de généraliser la surveillance électronique sous la forme d'une application #StopCovid, prenons du recul sur ces technologies soi-disant anonymisées.…
Lire la suite


9 min read

26 May 2020

Les modèles de machine learning sont de plus en plus utilisés dans nos applications car…
Lire la suite


8 min read

13 May 2020

Introduction Dans le cadre de mon travail sur Google Cloud Platform, j’ai eu la…
Lire la suite


8 min read

08 Apr 2020

Que ce soit pour effectuer un grand nombre d’insertions en base de données au…
Lire la suite


14 min read

06 Apr 2020

L’année 2020 est déjà bien entamée et la liste des bonnes résolutions est peut-être…
Lire la suite


8 min read

03 Apr 2020

Matillion est un ELT qui, depuis 2015, s’est installé parmi les plus en vogue…
Lire la suite


8 min read

10 Mar 2020

Nous avons vu dans l’article précédent les principales notions liées aux formats de données.…
Lire la suite


9 min read

02 Mar 2020

Être Data Engineer c’est beaucoup de développement, mais ce n’est pas que ça…
Lire la suite


5 min read

24 Feb 2020

IntroductionDans le cadre d’une mission, j’ai eu l'opportunité d'étudier la solution d’Apache…
Lire la suite


6 min read

17 Feb 2020

Koalas est une librairie open source développée par Databricks annoncée en mars 2019. Elle implémente les API Pandas pour Apache Spark. Elle unifie les API Pandas et Spark afin de rendre efficace Pandas dans la jungle du Big Data.…
Lire la suite


8 min read

03 Feb 2020

Cet article vise à synthétiser les principales idées et approches concernant la réplication des bases de données dans un système distribué.…
Lire la suite


13 min read

20 Jan 2020

Confluent a annoncé fin Novembre 2019, l’ajout de nouvelles features à leur moteur SQL de streaming KSQL (contraction de Kafka et SQL). Deux grosses évolutions de leur framework qui les a poussés à changer son petit nom : bienvenue à ksqlDB !…
Lire la suite


7 min read

06 Jan 2020