Dans un monde où le nombre d'objets connectés ne fait que croître avec…
Lire la suite
13 min read
19 févr. 2021
Valohai [https://valohai.com/] est une plateforme de gestion du cycle de vie des
modèles…
Lire la suite
8 min read
20 janv. 2021
L’opération merge
[https://docs.databricks.com/delta/delta-update.html#upsert-into-a-table-using-merge]
de l’API Delta…
Lire la suite
11 min read
21 déc. 2020
Cet article a pour objectif de vous présenter AWS Step Functions et de vous en donner une connaissance générale, tout en vous présentant quelques cas d’utilisation concrets.…
Lire la suite
12 min read
18 déc. 2020
Les progrès récents de l'apprentissage automatique (ML) ont produit des modèles
de taille…
Lire la suite
12 min read
17 déc. 2020
Les modèles d'apprentissage automatique (ML) créés par des Data Scientists
représentent une petite…
Lire la suite
10 min read
15 déc. 2020
Le temps de préparation des données dans un projet de Data Science/Machine
Learning est…
Lire la suite
9 min read
14 déc. 2020
Dans la partie précédente
[http://blog.ippon.fr/2020/11/30/ml-sagemaker-chalice-partie-1/], nous avons eu…
Lire la suite
6 min read
11 déc. 2020
Cet article technique vise à présenter Azure Data Factory (ADF), comment le mettre en place dans un environnement DevOps sur Microsoft Azure, et d’autres conseils que j’ai récoltés au fur et à mesure pour réussir vos pipelines ETL !…
Lire la suite
16 min read
04 déc. 2020
Au démarrage d'un projet, le choix de la base de données est une…
Lire la suite
12 min read
02 déc. 2020
Dans cette série de deux articles, nous verrons comment construire une
application simple d'…
Lire la suite
7 min read
30 nov. 2020
Oublier la cybersécurité, c'est “rouler à 200 km/h à moto sans casque".
Essayons de dresser le portrait de ce qu’on peut attendre d’un environnement Data sécurisé !…
Lire la suite
14 min read
23 nov. 2020
Apache Superset [https://superset.incubator.apache.org/] est un outil de
visualisation et d’exploration…
Lire la suite
6 min read
02 nov. 2020
Quand on regarde la quantité de librairies open-source il est très rare de trouver, caché, des librairies impactant autant la manière de penser le “compute”.
Une de ces librairies dont je voudrais vous parler aujourd’hui est Apache Arrow.
Il est temps de la mettre en lumière !…
Lire la suite
6 min read
28 oct. 2020
DBT [https://www.getdbt.com/] fait partie de ces outils qui peuvent faire gagner
beaucoup…
Lire la suite
5 min read
23 oct. 2020