Introduction
Dans le cadre d’une mission, j’ai eu l'opportunité d'…
Lire la suite
6 min read
17 févr. 2020
Koalas est une librairie open source développée par Databricks annoncée en mars 2019. Elle implémente les API Pandas pour Apache Spark. Elle unifie les API Pandas et Spark afin de rendre efficace Pandas dans la jungle du Big Data.…
Lire la suite
8 min read
03 févr. 2020
Cet article vise à synthétiser les principales idées et approches concernant la réplication des bases de données dans un système distribué.…
Lire la suite
13 min read
20 janv. 2020
Confluent a annoncé fin Novembre 2019, l’ajout de nouvelles features à leur moteur SQL de streaming KSQL (contraction de Kafka et SQL). Deux grosses évolutions de leur framework qui les a poussés à changer son petit nom : bienvenue à ksqlDB !…
Lire la suite
7 min read
06 janv. 2020
Cette douce matinée de novembre s’annonce comme un matin de Noël : la preview de…
Lire la suite
6 min read
20 déc. 2019
Pourquoi parler d’écologie et d’informatique ?
L’impact environnemental de l’informatique et de…
Lire la suite
7 min read
16 déc. 2019
Cet article fait partie d'une série visant à accompagner les entreprises dans
leur…
Lire la suite
13 min read
09 déc. 2019
Dans cet article, nous présentons le Schema Registry de Confluent, un composant
clé dans une…
Lire la suite
14 min read
18 nov. 2019
Create Table Component Ce composant permet la création de table dans l'entrepôt
de…
Lire la suite
11 min read
04 nov. 2019
La toute nouvelle certification
[https://academy.databricks.com/exam/crt020-scala] de développeur Spark de
Databricks…
Lire la suite
5 min read
14 oct. 2019
La construction d'un Data Warehouse est assez similaire au développement d'une…
Lire la suite
13 min read
07 oct. 2019
Problématique
En intervenant sur différents projets Spark (parfois en mode “pompier”) et en
recueillant les…
Lire la suite
7 min read
16 sept. 2019
Introduction
Qu’est ce qu’un moteur de recherche ? Vous me répondrez, certainement, un moteur…
Lire la suite
7 min read
06 sept. 2019
L’objet de ce document est de fournir des recommandations pour mieux utiliser, configurer, opérer et superviser la solution Snowflake dont Ippon est partenaire depuis début 2019.…
Lire la suite
5 min read
16 juil. 2019
Cet article fait un tour d’horizon des outils et services qui permettent
d’extraire…
Lire la suite
8 min read
17 juin 2019