Ippevent - Spark, ou comment traiter des données à la vitesse de l’éclair

La conférence Spark fait partie de la nouvelle génération de frameworks de manipulation de données basés sur Hadoop. L’outil utilise agressivement la mémoire pour offrir des temps de traitement jusqu’à 100 fois plus rapides. Dans cette session, nous découvrirons avec Alexis Seigneurin les principes de traitement de données (notamment MapReduce) et nous analyserons les options mises à disposition pour monter un cluster (HDFS, Tachyon, Yarn…). Une démonstration sera faite pour mettre en évidence les capacités du framework. Enfin, un point sera fait sur Spark Streaming pour le traitement de données en flux continu.Dans un second temps, Victor Coustenoble nous expliquera comment faire de l’analytique temps réel sur des données transactionnelles avec DataStax Cassandra + Spark, et nous fera découvrir l’intégration de Spark avec la base de données NoSQL Apache Cassandra.

Enfin, Didier Marin présentera un retour d’expérience sur l’utilisation de Spark pour la réalisation d’une plateforme d’analyse de données pour une filiale du groupe La Poste. Spark nous permet de traiter de larges volumes de log webs afin de qualifier le comportement de navigation des internautes. Ce talk mettra en lumière quelques uns des avantages et inconvénients de Spark sur ce type d’application.

Les speakers

Alexis Seigneurin est développeur depuis plus de 14 ans. Il est Manager Technique chez Ippon Technologies après avoir été CTO chez IDM. Ses sujets favoris sont Java, Spark, Node.js, AngularJS, Vagrant…

Victor Coustenoble travaille depuis 15 ans dans l’industrie du logiciel. Il a été consultant, chef de projet et avant-vente chez des éditeurs de data-mining (KXEN), de business intelligence (Jedox) et d’infrastructure (Tibco). Il est aujourd’hui ingénieur solution EMEA chez DataStax France.

Didier Marin est co-fondateur de Heuritech, société spécialisée dans le développement d’outils d’analyse de données pour les Big Data. Expert en Machine Learning, il s’intéresse également aux problématiques de traitement des données au sein d’architectures distribuées.

Infos pratiques

La conférence se tiendra le jeudi 11 Décembre 2014, à partir de 19h, dans les locaux d’Ippon Technologies, situés 43 – 47 Avenue de la Grande Armée (Paris). Un buffet aura ensuite lieu.