Ippon vous invite le 3 mars, à partir de 19h00, pour une soirée Web Scraping.
Récupérer un profil sur une page web est simple. Mais scraper 10 millions de profils est loin de l’être ! Les sites changent, protègent leurs données et l’on peut perdre des mois à construire un scraper…
Venez découvrir comment gagner du temps en évitant les pièges du scraping ! A travers un retour d’expériences et un lab, nous verrons comment construire un scraper, et éviter le blacklisting.
Et après cet Ippevent, la récupération de données n’aura plus de secret pour vous !
Prérequis
1/ Installer Python 2.7
2/ Cloner le dépôt https://github.com/fabienvauchelles/scraping-challenge-workshop
3/ Réaliser les étapes d’installation 0, 1 et 2 qui installent Scrapy et ses dépendances.
Remarque : nous conseillons aux participants sous Windows une VM linux.
Déroulement de la soirée
Partie 1 Présentation sur le Scraping, par Pierre Baillet (30 minutes)
Introduction, méthode, trucs & astuces, retour sur expérience
Partie 2 Présentation de Scrapy, par Fabien Vauchelles (10 minutes)
Architecture du framework, Installation, Comment l’utiliser
Partie 3 Hands on Scrapy, par Pierre & Fabien (45 minutes)
4 cas d’utilisations
Informations pratiques :
3 mars 2016 à partir de 19h00
47 avenue de la grande armée – 75116 Paris
Métro : Argentine