Data

Total 139 Posts

Dans la partie précédente, nous avons eu un aperçu de SageMaker Studio d'Amazon et nous…
Lire la suite


6 min read

11 Dec 2020

Cet article technique vise à présenter Azure Data Factory (ADF), comment le mettre en place dans un environnement DevOps sur Microsoft Azure, et d’autres conseils que j’ai récoltés au fur et à mesure pour réussir vos pipelines ETL !…
Lire la suite


16 min read

04 Dec 2020

Au démarrage d'un projet, le choix de la base de données est une étape importante…
Lire la suite


12 min read

02 Dec 2020

Dans cette série de deux articles, nous verrons comment construire une application simple d'apprentissage automatique…
Lire la suite


7 min read

30 Nov 2020

Oublier la cybersécurité, c'est “rouler à 200 km/h à moto sans casque". Essayons de dresser le portrait de ce qu’on peut attendre d’un environnement Data sécurisé !…
Lire la suite


14 min read

23 Nov 2020

Apache Superset est un outil de visualisation et d’exploration de données. Historiquement développé pour…
Lire la suite


6 min read

02 Nov 2020

Quand on regarde la quantité de librairies open-source il est très rare de trouver, caché, des librairies impactant autant la manière de penser le “compute”. Une de ces librairies dont je voudrais vous parler aujourd’hui est Apache Arrow. Il est temps de la mettre en lumière !…
Lire la suite


6 min read

28 Oct 2020

DBT fait partie de ces outils qui peuvent faire gagner beaucoup de temps sur un…
Lire la suite


5 min read

23 Oct 2020

Delta Lake apporte de nombreux avantages aux projets Data basés sur Spark. Il peut considérablement…
Lire la suite


6 min read

12 Oct 2020

ClickHouse, abrégé CH, est une base de données distribuée orientée colonnes (DBMS). Elle permet d’…
Lire la suite


11 min read

22 Sep 2020

Vous avez 5 minutes ? Venez découvrir les nouveautés de Snowflake annoncées le 2 juin 2020.…
Lire la suite


4 min read

20 Jul 2020

En mars 2019, la société américaine Prefect annonçait la mise à disposition en open source…
Lire la suite


12 min read

08 Jun 2020

Alors qu'on nous suggère de généraliser la surveillance électronique sous la forme d'une application #StopCovid, prenons du recul sur ces technologies soi-disant anonymisées.…
Lire la suite


9 min read

26 May 2020

Les modèles de machine learning sont de plus en plus utilisés dans nos applications car…
Lire la suite


8 min read

13 May 2020

Introduction Dans le cadre de mon travail sur Google Cloud Platform, j’ai eu la…
Lire la suite


8 min read

08 Apr 2020