Data

Total 191 Posts

Dans un monde où le nombre d'objets connectés ne fait que croître avec…
Lire la suite


13 min read

19 févr. 2021

Valohai [https://valohai.com/] est une plateforme de gestion du cycle de vie des modèles…
Lire la suite


8 min read

20 janv. 2021

L’opération merge [https://docs.databricks.com/delta/delta-update.html#upsert-into-a-table-using-merge] de l’API Delta…
Lire la suite


11 min read

21 déc. 2020

Cet article a pour objectif de vous présenter AWS Step Functions et de vous en donner une connaissance générale, tout en vous présentant quelques cas d’utilisation concrets.…
Lire la suite


12 min read

18 déc. 2020

Les progrès récents de l'apprentissage automatique (ML) ont produit des modèles de taille…
Lire la suite


12 min read

17 déc. 2020

Les modèles d'apprentissage automatique (ML) créés par des Data Scientists représentent une petite…
Lire la suite


10 min read

15 déc. 2020

Le temps de préparation des données dans un projet de Data Science/Machine Learning est…
Lire la suite


9 min read

14 déc. 2020

Dans la partie précédente [http://blog.ippon.fr/2020/11/30/ml-sagemaker-chalice-partie-1/], nous avons eu…
Lire la suite


6 min read

11 déc. 2020

Cet article technique vise à présenter Azure Data Factory (ADF), comment le mettre en place dans un environnement DevOps sur Microsoft Azure, et d’autres conseils que j’ai récoltés au fur et à mesure pour réussir vos pipelines ETL !…
Lire la suite


16 min read

04 déc. 2020

Au démarrage d'un projet, le choix de la base de données est une…
Lire la suite


12 min read

02 déc. 2020

Dans cette série de deux articles, nous verrons comment construire une application simple d'…
Lire la suite


7 min read

30 nov. 2020

Oublier la cybersécurité, c'est “rouler à 200 km/h à moto sans casque". Essayons de dresser le portrait de ce qu’on peut attendre d’un environnement Data sécurisé !…
Lire la suite


14 min read

23 nov. 2020

Apache Superset [https://superset.incubator.apache.org/] est un outil de visualisation et d’exploration…
Lire la suite


6 min read

02 nov. 2020

Quand on regarde la quantité de librairies open-source il est très rare de trouver, caché, des librairies impactant autant la manière de penser le “compute”. Une de ces librairies dont je voudrais vous parler aujourd’hui est Apache Arrow. Il est temps de la mettre en lumière !…
Lire la suite


6 min read

28 oct. 2020

DBT [https://www.getdbt.com/] fait partie de ces outils qui peuvent faire gagner beaucoup…
Lire la suite


5 min read

23 oct. 2020