Author image

30 posts

Migrer de Kafka vers Kinesis

Cet article fait partie d'une série visant à accompagner les entreprises dans leur migration d'un SI Big Data existant vers les offres cloud d'AWS. Le but de cette série n'est pas de faire un comparatif détaillé sur l'intérêt d'une migration vers le Cloud ! Nous supposons que le choix est déjà

Big Data et Kubernetes (2/2)

Cet article conclu la série consacrée à Kubernetes et le Big Data. Cas concret Ce chapitre présente un état des lieux et une évaluation de la maturité des solutions Big Data à s'exécuter sur Kubernetes. Toute solution est apte à s'exécuter sur Kubernetes. Une condition suffisante mais pas obligatoire étant

Big Data et Kubernetes (1/2)

Dans cette suite d'articles, nous allons discuter de la mise en place d'une plate-forme Big Data utilisant l'orchestrateur Kubernetes. Kubernetes étant en effet le sujet du moment, notamment en ce qui concerne l'utilisation de conteneurs avec des microservices. Ce premier article n'est pas une présentation détaillée de Kubernetes, mais vous

Streaming et latence Kafka

Kafka est très répandu dans les architectures Big Data orientées événements. Un cas d'utilisation typique est son utilisation pour la synchronisation entre des systèmes existants (et souvent centralisés) vers des systèmes distribués. Les modifications du système source sont émises sous forme de messages dans Kafka et récupérées et traitées pour

TamTam - MongoDB is now fully reliable

The famous “call me maybe” distributed system testing by Jepsen proved that MongoDB was unsafe in particular faulty networks. The replication protocol v0 was responsible of losing updates even at the strongest level of write safety. Dirty and stales reads were also identified. MongoDB admitted it and worked to improve

Big Data 2.0 ?

Dans cet article je vais vous présenter les conditions de création du livre blanc Big Data 2016 architectures et solutions disponible à l’adresse suivante : http://explore.big-data.fr Il y a eu le web 2.0 qui a lancé la révolution web et il y aurait donc le Big

Apache Flink et Spark : redondance ?

Apache Flink est un Top Level Project Apache depuis décembre 2014. Anciennement nommé Stratosphere et projet de recherche par Data Artisans il a été crée en 2009 (comme Spark). Dans cet article nous allons comparer Spark et Flink deux projets Apache répondant au même besoin : fournir un framework de traitements

MongoDB v3 : la révolution ? (1/2)

MongoDB v3 : les nouveautés Le 3 février dernier, MongoDB a fait une annonce importante : la sortie de la version 3 de leur solution NoSQL (anciennement désignée comme version 2.8). Annoncée pour mars, la version 3 de MongoDB est très attendue. MongoDB a souvent été attaqué pour ses performances en