Le Big Data est à la mode et je commencerai cet article par lister les freins qui empêchent encore les entreprises de franchir le pas, malgré les avantages que le Big Data peut apporter. Pour terminer ce mois du temps fort du Big Data chez Ippon, je voulais surtout faire un panorama des architectures types du Big Data. Ce retour est d’autant plus intéressant que les solutions ont maintenant quelques années d’exploitation en production.

Nous voyons donc arriver les premiers retours d’expérience sur les architectures mises en place.

 La conférence Spark fait partie de la nouvelle génération de frameworks de manipulation de données basés sur Hadoop. L’outil utilise agressivement la mémoire pour offrir des temps de traitement jusqu’à 100 fois plus rapides. Dans cette session, nous découvrirons avec Alexis Seigneurin les principes de traitement de données (notamment MapReduce) et nous analyserons les options […]

Pour l’évènement de la sortie de Java 8, Ippon vous propose plusieurs posts sur les nouveautés du langage. A lire également : Java 8 – Gestion du temps Java 8 – Interfaces fonctionnelles Jusqu’à présent, effectuer des traitements sur des Collections ou des tableaux (de type MapReduce) en Java passait essentiellement par l’utilisation du pattern Iterator. […]

Dans cet article nous allons étudier la possibilité d’exécuter des tâches MapReduce en dehors d’Hadoop. En particulier nous allons étudier les possibilités offertes par les grilles de données open source Java. Introduction L’impression actuelle est que tous les éditeurs veulent prendre le train Hadoop en route et se positionnent sur ce marché quitte à brouiller […]

Aujourd’hui il est difficile de se retrouver dans la jungle d’Hadoop pour les raisons suivantes :
– Ce sont des technologies jeunes.
– Beaucoup de buzz et de communication de sociétés qui veulent prendre le train Big Data en marche.
– Des raccourcis sont souvent employés (non MapReduce ou un équivalent n’est pas suffisant pour parler d’Hadoop).
– Beaucoup d’acteurs différents (des mastodontes, des spécialistes du web, des startups, …).

Dans cet article on évoquera les trois distributions majeures que sont Cloudera, Hortonworks et MapR, toutes les trois se basant sur Apache Hadoop.