Author image

35 posts

Ippevent Spark - Les slides

Voici les slides de l’Ippevent Spark de jeudi 19 février. N’hésitez pas à prendre contact avec nous si vous souhaitez organiser un Brown Bag Lunch ou pour réaliser un POC sur vos projets. Spark – par Alexis Seigneurin (Ippon Technologies) Spark – Ippevent 19-02-2015 from Alexis Seigneurin Spark + Cassandra – par

Ippon à Devoxx France 2015

La quatrième édition de Devoxx France aura lieu en avril prochain et Ippon est fier de sponsoriser l’évènement depuis sa première édition ! Vous pourrez venir nous rencontrer sur notre stand et, surtout, nous vous proposerons plusieurs talks de qualité : 3 conférences, un tools-in-action, un hands-on-lab et un hackaton. Détails

Spark vs Command line tools

Il y a quelques jours, un post d’Adam Drake a refait surface sur Twitter : Command-line tools can be 235x faster than your Hadoop cluster. Adam explique qu’il a reproduit un traitement Hadoop avec des outils de ligne de commande (find, awk…) multipliant ainsi le débit de traitement par

Introduction à Spark SQL

Spark permet de manipuler d’importants volumes de données en utilisant une API de bas niveau. Pour simplifier l’exploration des données, Spark SQL offre une API de plus haut niveau avec une syntaxe SQL. Spark SQL permet ainsi de réaliser, très rapidement, de nombreuses opérations sans écrire de code.

Introduction à Spark Streaming

Spark permet de traiter des données qui sont figées à un instant T. Grâce au module Spark Streaming, il est possible de traiter des flux de données qui arrivent en continu, et donc de traiter ces données au fur et à mesure de leur arrivée. Modèle de micro-batches Avec Spark

Utiliser Apache Spark en cluster

Dans les précédents posts, nous avons utilisé Apache Spark avec un exécuteur unique. Spark étant un framework de calcul distribué, nous allons maintenant monter un cluster en mode standalone. Topologie Un cluster Spark se compose d’un master et d’un ou plusieurs workers. Le cluster doit être démarré et

Initiation au MapReduce avec Apache Spark

Dans le précédent post, nous avons utilisé l’opération Map qui permet de transformer des valeurs à l’aide d’une fonction de transformation. Nous allons maintenant découvrir l’opération Reduce qui permet de faire des aggrégations. Nous allons ainsi pouvoir faire du MapReduce de la même manière qu’avec

Introduction à Apache Spark

Spark est un outil permettant de faire du traitement de larges volumes de données, et ce, de manière distribuée (cluster computing). Le framework offre un modèle de programmation plus simple que celui d’Hadoop et permet des temps d’exécution jusqu’à 100 fois plus courts. Le framework a le

Quickie sur Java 8 à BDX.io

Le vendredi 17 octobre se tiendra la première édition de BDX.io, une conférence pour développeurs à Bordeaux. Au programme, 40 talks sur des sujets du moment : on y parlera de langages (Java, Go, Clojure…), de développement Web (AngularJS, Web Components…), de déploiement (Docker), de bases de données NoSQL (Mongo…

Retour sur le Breizh Camp 2014

Le Breizh Camp 2014 est déjà terminé pour moi. Sur deux jours et demi, la conférence organisée sur le campus universitaire de Rennes a accueilli 250 personnes. Au programme, 80 talks, tous formats confondus (conférences, hands-on labs, tools in action, quickies) ! Retour sur deux conférences auxquelles j’ai assisté. Continuous

[DevoxxFR 2014] Crazyflie Nano

Parce que le Devoxx ne parle pas que de Java, je voulais revenir sur le talk d’Arnaud Taffanel et de Marcus Eliasson sur la génèse du Crazyflie Nano, un quadricoptère de seulement 19 grammes. Le projet initial était de mettre au point un “grand” quadricoptère. Le besoin de connaissances

[DevoxxFR 2014] Le retour !

La troisième édition de Devoxx France s’est déroulée du 16 au 18 avril dernier. Cette spin-off de Devoxx Belgique est immédiatemment devenue le rendez-vous incontournable des développeurs. L’évènement est tellement populaire que les places se sont arrachées en un temps record. Malgré tout, nous sommes plus de 50