Data

Total 194 Posts

Introduction Dans le cadre d’une mission, j’ai eu l'opportunité d'…
Lire la suite


6 min read

17 févr. 2020

Koalas est une librairie open source développée par Databricks annoncée en mars 2019. Elle implémente les API Pandas pour Apache Spark. Elle unifie les API Pandas et Spark afin de rendre efficace Pandas dans la jungle du Big Data.…
Lire la suite


8 min read

03 févr. 2020

Cet article vise à synthétiser les principales idées et approches concernant la réplication des bases de données dans un système distribué.…
Lire la suite


13 min read

20 janv. 2020

Confluent a annoncé fin Novembre 2019, l’ajout de nouvelles features à leur moteur SQL de streaming KSQL (contraction de Kafka et SQL). Deux grosses évolutions de leur framework qui les a poussés à changer son petit nom : bienvenue à ksqlDB !…
Lire la suite


7 min read

06 janv. 2020

Cette douce matinée de novembre s’annonce comme un matin de Noël : la preview de…
Lire la suite


6 min read

20 déc. 2019

Pourquoi parler d’écologie et d’informatique ? L’impact environnemental de l’informatique et de…
Lire la suite


7 min read

16 déc. 2019

Cet article fait partie d'une série visant à accompagner les entreprises dans leur…
Lire la suite


13 min read

09 déc. 2019

Dans cet article, nous présentons le Schema Registry de Confluent, un composant clé dans une…
Lire la suite


14 min read

18 nov. 2019

Create Table Component Ce composant permet la création de table dans l'entrepôt de…
Lire la suite


11 min read

04 nov. 2019

La toute nouvelle certification [https://academy.databricks.com/exam/crt020-scala] de développeur Spark de Databricks…
Lire la suite


5 min read

14 oct. 2019

La construction d'un Data Warehouse est assez similaire au développement d'une…
Lire la suite


13 min read

07 oct. 2019

Problématique En intervenant sur différents projets Spark (parfois en mode “pompier”) et en recueillant les…
Lire la suite


7 min read

16 sept. 2019

Introduction Qu’est ce qu’un moteur de recherche ? Vous me répondrez, certainement, un moteur…
Lire la suite


7 min read

06 sept. 2019

L’objet de ce document est de fournir des recommandations pour mieux utiliser, configurer, opérer et superviser la solution Snowflake dont Ippon est partenaire depuis début 2019.…
Lire la suite


5 min read

16 juil. 2019

Cet article fait un tour d’horizon des outils et services qui permettent d’extraire…
Lire la suite


8 min read

17 juin 2019