Data

Total 120 Posts

Être Data Engineer c’est beaucoup de développement, mais ce n’est pas que ça…
Lire la suite


5 min read

24 Feb 2020

IntroductionDans le cadre d’une mission, j’ai eu l'opportunité d'étudier la solution d’Apache…
Lire la suite


6 min read

17 Feb 2020

Koalas est une librairie open source développée par Databricks annoncée en mars 2019. Elle implémente les API Pandas pour Apache Spark. Elle unifie les API Pandas et Spark afin de rendre efficace Pandas dans la jungle du Big Data.…
Lire la suite


8 min read

03 Feb 2020

Cet article vise à synthétiser les principales idées et approches concernant la réplication des bases de données dans un système distribué.…
Lire la suite


13 min read

20 Jan 2020

Confluent a annoncé fin Novembre 2019, l’ajout de nouvelles features à leur moteur SQL de streaming KSQL (contraction de Kafka et SQL). Deux grosses évolutions de leur framework qui les a poussés à changer son petit nom : bienvenue à ksqlDB !…
Lire la suite


7 min read

06 Jan 2020

Cette douce matinée de novembre s’annonce comme un matin de Noël : la preview de…
Lire la suite


6 min read

20 Dec 2019

Pourquoi parler d’écologie et d’informatique ?L’impact environnemental de l’informatique et de…
Lire la suite


7 min read

16 Dec 2019

Cet article fait partie d'une série visant à accompagner les entreprises dans leur migration d'un…
Lire la suite


13 min read

09 Dec 2019

Dans cet article, nous présentons le Schema Registry de Confluent, un composant clé dans une…
Lire la suite


14 min read

18 Nov 2019

Introduction La société Matillion édite un outil de traitement de données permettant de récupérer, préparer…
Lire la suite


11 min read

04 Nov 2019

La toute nouvelle certification de développeur Spark de Databricks (CRT020: Databricks Certified Associate Developer for…
Lire la suite


5 min read

14 Oct 2019

La construction d'un Data Warehouse est assez similaire au développement d'une application comprenant une BDD…
Lire la suite


13 min read

07 Oct 2019

Problématique En intervenant sur différents projets Spark (parfois en mode “pompier”) et en recueillant les…
Lire la suite


7 min read

16 Sep 2019

Introduction Qu’est ce qu’un moteur de recherche ? Vous me répondrez, certainement, un moteur…
Lire la suite


7 min read

06 Sep 2019

L’objet de ce document est de fournir des recommandations pour mieux utiliser, configurer, opérer et superviser la solution Snowflake dont Ippon est partenaire depuis début 2019.…
Lire la suite


5 min read

16 Jul 2019