La veille technologique dans la Data

INTRODUCTION

Dès nos premiers pas dans l’informatique, nous comprenons vite que la veille technologique est cruciale.

Toutefois, il peut nous manquer certaines clés, afin de savoir où chercher les informations et c’est dans ce but que j’ai écrit cet article. Je vais vous faire part des divers moyens de faire de la veille sur les technologies Data.

Bien entendu, les outils dont je vais parler sont valables dans l’informatique de manière générale. Cependant les sites, blogs et autres sources que je citerai seront orientés Data.

Je vais dans un premier temps vous présenter les ressources virtuelles (Blog, Site web, dépôts Git, Podcast, Newsletters, Webinar, sites de formations) pour ensuite parler des ressources réelles (Slack, Meetup, rencontre d’autres professionnels, salons et conférences).

LES BLOGS ET SITES WEB

Il existe énormément de sites web et blogs sur le Big Data. Le plus dur est de trouver celui qui nous intéresse.

Si vous recherchez des actualités grand public, n’entrant pas dans des considérations techniques complexes autour du Big Data, je vous conseillerais plus le monde informatique (rubrique Big Data, Cloud, IOT et Datacenter) qui permet de se faire une culture générale sur les possibilités et nouveautés du domaine.

En revanche, si vous recherchez des actualités plus spécifiques (Data Engineering, Data Science…) tout en balayant un large spectre de technologies, le plus intéressant est d’aller sur les blogs d’ESN qui sont spécialisées dans le sujet. À titre d’exemple, si c’est le Data Engineering / Data architecture que vous recherchez, alors le blog d’Ippon Technologies est fait pour vous.

Cependant, si vous préférez la Data Science, le blog de Quantmetry saura vous combler. Vous pouvez également trouver les blogs techniques d’entreprises reconnues comme Uber, Airbnb, Spotify, Netflix et LinkedIn, mais aussi des blogs d’informations comme Reddit pour le Data Engineering ou Kaggle pour la Data Science.

Dans le cas où c’est une technologie bien précise qui vous intéresse, open source ou non, les sites, blogs des éditeurs et les git regorgent d’informations.

Concernant les technologies open sources, il peut être aussi utile de consulter le site web des éditeurs payants, comme Datastax dans le cas de Cassandra, qui possède le site Datastax Academy, avec des formations et des actus propres à l’outil.

On citera aussi les blogs AWS, GCP et Azure, pour les technologies cloud par exemple, ou les blogs de Cloudera ou Hortonworks (qui devraient fusionner sous peu) pour les frameworks Hadoop.

Il existe tellement de sources que je ne pourrais pas toutes les citer mais vous pouvez vous renseigner sur les différents blogs et sites web en fonction de vos attentes.

LES DÉPÔTS GIT

GitHub et GitLab sont des services web d'hébergement et de gestion de développement de logiciel.

Ces outils sont communautaires, donc particulièrement utilisés pour les projets open source, dont ceux de la suite Apache par exemple. Ils mettent donc à disposition le code ainsi que les manuels d’utilisation des projets, et la communauté peut y proposer des modifications.

Dans notre cas, ce qui nous intéresse, c’est de pouvoir alors suivre les évolutions d’outils Data en direct. Comme dit précédemment, Apache est présent sur GitHub, et il y en existe d’autre comme Elasticsearch par exemple.

On peut donc suivre les évolutions au cœur du développement et même y participer si on le souhaite. Outre les dépôts Git propres à un outil Data, il existe aussi des comptes qui recensent l’ensemble de ces outils comme Awesome Big Data pour le Big Data, et Awesome Data Engineering pour le Data Engineering.

LES RÉSEAUX SOCIAUX

Je vais parler principalement de Twitter, mais globalement l’ensemble des propos suivants sont également valables sur les autres réseaux sociaux (LinkedIn, parfois Facebook).

Twitter est l’outil qui permet réellement de regrouper l’ensemble des méthodes décrites précédemment.

En effet, si vous êtes intéressé par une technologie en particulier, vous pouvez suivre son compte, qui partagera forcément les nouveautés. Elles ont toutes un compte Twitter : AWS, Matillion, Cassandra, Kafka, MongoDB
Il existe aussi de nombreux comptes spécialisés. Ils vont regrouper et partager des articles, vidéo en lien avec le thème choisi, je pense par exemple au compte Big Data & BI

Enfin, il est également possible de suivre certains professionnels qui ont un compte Twitter quasi dédié à la veille technologique et qui partageront des articles et donneront leur avis. Je conseille notamment ce compte pour le Data Engineering.

Afin de trouver des personnes à suivre, n'hésitez pas à aller voir qui partage régulièrement des articles sur les # qui vous intéressent par exemple.

LES NEWSLETTERS

Dans la même lignée que les réseaux sociaux, les newsletters permettent d’avoir un résumé des nouveautés directement dans sa boite mail. Il en existe de multitude en fonction du domaine qui vous intéresse.

Dans notre cas, on notera Data Eng pour tout ce qui concerne le Data Engineering et Data Elixir pour la Data Science.

L'intérêt est d’avoir un mail hebdomadaire qui nous rappelle de faire cette veille, tout en récapitulant l’actualité technique et autre comme les événements. Cependant, il faut faire attention, car la liste des actualités n’est pas exhaustive. Il convient alors de ne pas se fier uniquement à une newsletter.

LES PODCASTS

Souvent oublié, le podcast est très pratique pour les personnes n’ayant pas le temps de lire. Il existe de nombreux podcasts sur énormément de sujet. Il y a aussi beaucoup d’applications afin de pouvoir les suivre depuis votre smartphone et tablette (Spreaker par exemple).

Dans le cadre du Big Data par exemple, il existe le BigData Hebdo et DataBuzzWord. Ce sont des podcasts plus ou moins hebdomadaires (l'écart entre deux émissions peut être variable) qui nous font part des dernières actualités autour de la Data d’un point de vue technique.

Je les recommande particulièrement si vous souhaitez une actualité sur diverses technologies. Cela permet à la fois de découvrir de nouveaux outils et aussi de savoir ce qu’il va se passer sur ceux que nous utilisons déjà.

De plus, BigData Hebdo dispose d’un Slack (que je vous encourage à rejoindre) et d’une communauté très active qui permettent d’aller plus en profondeur sur les sujets évoqués au cours des émissions.

On peut aussi facilement se procurer les comptes Twitter des intervenants et présentateurs en écoutant les émissions. Utile si vous voulez utiliser les réseaux sociaux pour votre veille. Le petit point bonus est qu’il existe depuis 2014, et il est toujours intéressant de voir les évolutions qui ont eu lieu les 5 dernières années et le ressenti à l’instant T de certaines technologies.

WEBINAIRE

Lorsqu'on s'inscrit sur des sites éditeurs, ou lorsque notre entreprise utilise un outil, il n’est pas rare de recevoir des invitations à un webinaire par mail. Ces webinaires sont extrêmement utiles. En dehors d’apprendre les bonnes pratiques et d’avoir des trucs et astuces sur la solution utilisée, cela permet aussi de voir comment fonctionne la dernière version du logiciel (car les animateurs de l'émission auront souvent la version la plus récente) et d’en savoir plus sur les nouveautés à venir.

Petit point bonus, il est également possible de poser des questions sur le moment, et si vous êtes inscrit, mais pas disponible à la date prévue, il est souvent enregistré et visible par la suite (à voir au cas par cas).

LES SITES DE FORMATIONS

La mutation du monde de la formation a laissé apparaître beaucoup de sites de formations en ligne, certifiantes ou non. Ils ne servent donc pas particulièrement à faire de la veille technologique, mais plus à se former sur une techno qui nous a intéressé au cours de notre veille, c'est pourquoi j'en parle dans cet article. Les sites présents ne sont pas spécialisés dans la Data. Ils interviennent dans de nombreux domaines, pas uniquement informatiques.

Il y a des sites de formations vidéos tels que Alphorm ou Udemy, tous les deux payants, mais avec des réductions régulières qui permettent d’avoir un cours de Kafka ou AWS pour 10 euros.

OpenClassroom, FUN et Edx quant à eux sont assez polyvalents, ils proposent des cours gratuits, seule la certification est payante. Une bonne solution si l'on veut juste de la connaissance.

YouTube peut bien sûr être utile pour comprendre le concept de certains produits, y trouver des conférences et Webinaires. Cependant, les cours peuvent vite être dépassés, il faut donc faire attention à leur date de parution, de plus ils sont souvent légers techniquement.

LES MEETUP ET RENCONTRES D’AUTRES PROFESSIONNELS

Meetup est une plateforme de réseautage social qui permet aux membres de rencontrer des groupes unis par un intérêt commun. On y trouve de nombreuses communautés Data (sur Paris, Lyon, Bordeaux, Toulouse, Lille, Nantes …) généralistes ou spécialisées.

Chaque communauté organise ses meetups, gratuits ou payants, qui permettent de se documenter sur les dernières technologies et également de rencontrer de nombreuses personnes travaillant dans notre domaine. On peut donc agrandir son réseau pro tout en se formant.

La rencontre d’autres professionnels est un aspect non négligeable de la veille technologique. On peut ainsi échanger sur les différents use cases, les retours d'expériences, ou même, nous faire découvrir des applications et technologies auxquelles nous n’aurions jamais pensé.

Si vous souhaitez rencontrer d’autres professionnels de manière plus personnalisée, je vous encourage à télécharger Shapr. C’est une application de rencontre professionnelle, où nous mettons nos centres d'intérêt (pro et perso) et ce que nous recherchons. Suivant le même modèle que Tinder, chaque jour des personnes pouvant vous correspondre et localisées à proximité, sont proposées. Ensuite à vous de swiper à droite ou gauche en attendant le match.
Dans notre cas, l'intérêt est justement de nous permettre de discuter avec des personnes qui ont des expériences différentes sur des sujets Data, et ce, dans un cadre plus personnel.

SLACK

Slack, pour ceux qui ne connaissent pas, est une plateforme collaborative pour le travail. Le BigData Hebdo par exemple, dispose d’un Slack, composé de chaînes dans lesquelles on peut discuter des sujets Data, sous forme de tchat.

Dans le cadre de la veille technologique, cela peut être un outil majeur. Il existe des Slack spécialisés sur un outil en particulier comme Confluent pour Kafka, MongoDB, Datastax pour Cassandra, Spark...

Dans un cadre plus généraliste, je vous encourage à consulter l’article de Data economy qui recense les principaux Slack Data dans lequel vous devriez trouver votre bonheur, ou bien l’article de Towards Data Science si vous recherchez plus de la Data Science. Sinon, comme dit précédemment dans la partie “Podcast”, vous pouvez aussi retrouver celui du BigData Hebdo (accessible sur demande via contact@bigdatahebdo.com).

LES SALONS ET CONFÉRENCES

Comment parler de veille technologique sans parler des salons et conférences ?
Ces événements permettent de regrouper un ensemble de grands acteurs du marché, des professionnels passionnés et les conférences sont souvent le lieu d’annonces importantes. Les articles et annonces que nous trouvons sur internet sont souvent issus de ces conférences. Je pense notamment à Devoxx, un salon reconnu, pour les développeurs.

Dans notre domaine, il y a les DATAXDAYS organisés par Xebia, très orienté Data Engineering, et la Duck Conf organisée par OCTO, plus orientée Architecture SI. Le salon du Big Data est plus connu, mais il reste très axé commercial, donc moins intéressant dans notre cas.

Le principal problème étant le prix de l’entrée, il est donc compliqué d’y assister lorsqu’on est étudiant ou junior. Toutefois, systématiquement, il y a une rediffusion sur YouTube. Nous pouvons ainsi y retrouver les conférences généralistes (suivre les chaînes XebiaTv pour les DATADAYS et LaDuckConf pour La Duck Conf) et les conférences éditeurs comme AWS qui a sa chaîne YouTube “Amazon Web Service”, “Confluent” qui rediffuse ses conférences Kafka summit, “Spark summit” pour les Spark summit … .

Si vous souhaitez participer à un event Data autour de vous, je vous conseille d’aller sur eventbrite.fr et de rechercher les évènements en lien avec le Big Data autour de votre position.

EN ENTREPRISE

Au sein des entreprises, il existe souvent des canaux de discussions de veille technologique et des moyens internes de se maintenir à jour. Il ne faut pas hésiter à demander.

Cependant, si vous aimez vous documenter, évoluer et toujours être sur les dernières technologies, je vous encourage alors à travailler dans une ESN orientée Data (ou avec un pôle alloué). La variété des projets permet d’avoir un travail diversifié dans le fond et la forme. De plus, elles poussent souvent à la veille et la formation, car c’est votre plus-value en tant que consultant.

Si vous êtes en recherche d’emploi et que vous cherchez une entreprise de ce type, n'hésitez pas à lire les publications et actualités de l'entreprise via leur blog technique (si elle en a un), et ses réseaux sociaux. Vous pourrez ainsi voir l’esprit global de l’entreprise. En cas de doute, allez sur Glassdoor, afin d'y consulter l’avis des employés. Le cas échéant, allez directement leur demander via LinkedIn.

CONCLUSION

Il existe énormément de moyens de faire de la veille technologique. Cependant, gardez à l’esprit qu’un seul canal de veille ne suffira pas. Il conviendra de toujours se fier à différentes sources et d’utiliser différents outils afin d’avoir une vue d’ensemble des sujets qui vous intéressent. Une seule source ne sera jamais exhaustive, neutre et parfaitement en phase avec vos besoins et vos envies de veille.

À vous de trouver votre rythme avec le temps et le niveau d’engagement que vous êtes prêt à mettre. Il ne faut pas négliger cette veille qui est une partie de notre travail et qui est un véritable investissement sur nous-mêmes.