Pour les amoureux de Spark et de programmation fonctionnelle 😉 Gianmario Spacagna a créé SparkZ, une extension de Spark qui permet aux utilisateurs du framework de développer dans un style plus purement fonctionnel. Spark propose en effet pour ses RDD une API respectant ce paradigme, mais le reste du code est décrié par les développeurs pour […]

Une nouvelle version de Spark vient de sortir hier. Elle apporte, notamment : l’API Dataset : proche de l’API RDD avec les avantages du moteur Spark SQL, des optimisations de performances pour les modules Core/SQL et Streaming, ainsi que de nouveaux algorithmes/modèles pour MLlib. l’API Dataset est encore taguée expérimentale. Il est prévu après la 1.6 […]

Le 1er Octobre, le dernier Meetup Hadoop s’est réuni dans un cadre sympathique (avec vue sur Notre-Dame pour le pot suivant les présentations) sur la péniche “La Nouvelle Seine”. Ce meetup était sponsorisé par Ippon Technologies. Un lien sera bientôt disponible pour vous permettre de visionner cette session. Pour cette session de Meetup Hadoop organisée […]

Evénement Machine Learning

La donnée est partout. Il est devenu relativement simple de la stocker. Maintenant vient la question de la valoriser. Identifier ses clients, définir des catégories, anticiper des souhaits d’achat, mais aussi prédire des tendances, optimiser des stocks, … les possibilités offertes par les volumes de données et les algorithmes appropriés sont grandes. Parmi les approches, […]