Author image

Alexis Seigneurin

Ippevent Spark - Les slides

Voici les slides de l’Ippevent Spark de jeudi 19 février. N’hésitez pas à prendre contact avec nous si vous souhaitez organiser un Brown Bag Lunch ou pour réaliser un POC sur vos projets. Spark – par Alexis Seigneurin [https://twitter.com/ASeigneurin] (Ippon Technologies [https://twitter.com/ippontech]) Spark

Ippon à Devoxx France 2015

[http://www.devoxx.fr/]La quatrième édition de Devoxx France aura lieu en avril prochain et Ippon est fier de sponsoriser l’évènement depuis sa première édition ! Vous pourrez venir nous rencontrer sur notre stand et, surtout, nous vous proposerons plusieurs talks de qualité : 3 conférences, un tools-in-action, un hands-on-lab

Spark vs Command line tools

Il y a quelques jours, un post d’Adam Drake a refait surface sur Twitter : Command-line tools can be 235x faster than your Hadoop cluster [http://aadrake.com/command-line-tools-can-be-235x-faster-than-your-hadoop-cluster.html] . Adam explique qu’il a reproduit un traitement Hadoop avec des outils de ligne de commande (find, awk…) multipliant ainsi

Introduction à Spark SQL

Spark permet de manipuler d’importants volumes de données en utilisant une API de bas niveau. Pour simplifier l’exploration des données, Spark SQL offre une API de plus haut niveau avec une syntaxe SQL. Spark SQL permet ainsi de réaliser, très rapidement, de nombreuses opérations sans écrire de code.

Retour sur l'année 2014 : Docker et Spark

L’année 2014 s’achève en ayant apporté son lot de nouveautés. Retour sur deux d’entre elles. L’émergence des containers Le moins que l’on puisse dire, c’est que, ces 12 derniers mois, Docker a été sur toutes les lèvres. Pas une conférence de développeurs ne s’

Introduction à Spark Streaming

Spark permet de traiter des données qui sont figées à un instantT. Grâce au module Spark Streaming, il est possible de traiter des flux de données qui arrivent en continu, et donc de traiter ces données au fur et à mesure de leur arrivée. Modèle de micro-batches Avec Spark Streaming,

Utiliser Apache Spark en cluster

Dans les précédents posts, nous avons utilisé Apache Spark avec un exécuteur unique. Spark étant un framework de calcul distribué, nous allons maintenant monter un cluster en modestandalone. Topologie Un cluster Spark se compose d’unmasteret d’un ou plusieursworkers. Le cluster doit être démarré et rester actif pour pouvoir

MapReduce et manipulation de RDD par clés avec Apache Spark

Nous avons vu dans le post précédent [https://blog.ippon.fr/2014/11/13/initiation-au-mapreduce-avec-apache-spark/] qu’Apache Spark permettait de réaliser des opérations d’agrégation sur l’ensemble des valeurs d’un RDD. Nous allons maintenant réaliser des agrégations ainsi que d’autres manipulations par clés. La théorie Une opération

Initiation au MapReduce avec Apache Spark

Dans le précédent post [https://blog.ippon.fr/2014/11/06/introduction-a-apache-spark/], nous avons utilisé l’opération Map qui permet de transformer des valeurs à l’aide d’une fonction de transformation. Nous allons maintenant découvrir l’opération Reduce qui permet de faire des aggrégations. Nous allons ainsi pouvoir faire

Introduction à Apache Spark

Spark [http://spark.apache.org/] est un outil permettant de faire du traitement de larges volumes de données, et ce, de manière distribuée (cluster computing). Le framework offre un modèle de programmation plus simple que celui d’Hadoop et permet des temps d’exécution jusqu’à 100 fois plus courts.

Quickie sur Java 8 à BDX.io

Le vendredi 17 octobre se tiendra la première édition de BDX.io [http://www.bdx.io/], une conférence pour développeurs à Bordeaux. Au programme, 40 talks sur des sujets du moment : on y parlera de langages (Java, Go, Clojure…), de développement Web (AngularJS, Web Components…), de déploiement (Docker), de bases

Retour sur le Breizh Camp 2014

Le Breizh Camp 2014 est déjà terminé pour moi. Sur deux jours et demi, la conférence organisée sur le campus universitaire de Rennes a accueilli 250 personnes. Au programme, 80 talks, tous formats confondus (conférences, hands-on labs, tools in action, quickies) ! Retour sur deux conférences auxquelles j’ai assisté. Continuous

[DevoxxFR 2014] Crazyflie Nano

Parce que le Devoxx ne parle pas que de Java, je voulais revenir sur le talk d’Arnaud Taffanel et de Marcus Eliasson sur la génèse du Crazyflie Nano, un quadricoptère de seulement 19 grammes. Le projet initial était de mettre au point un “grand” quadricoptère. Le besoin de connaissances

[DevoxxFR 2014] Le retour !

La troisième édition de Devoxx France s’est déroulée du 16 au 18 avril dernier. Cette spin-off de Devoxx Belgique est immédiatemment devenue le rendez-vous incontournable des développeurs. L’évènement est tellement populaire que les places se sont arrachées en un temps record. Malgré tout, nous sommes plus de 50