Le Web est un réservoir titanesque d'informations, constamment mis à jour. Peut-on extraire de ce vaste creuset des données utiles pour son activité ? C'est ce que propose le Web scraping.

Cela vous intéressera aussi

[EN VIDÉO] L’incroyable trajet du trafic internet mondial Lorsqu’on se connecte à Internet, nos données empruntent un très long trajet. Un email parcourt...

Quelle que soit l'activité que l'on pratique, la possession de certaines informations est en mesure de changer le cours des choses. Nous en avons un exemple dans le film Tout le monde dit "I love you". La patiente interprétée par Julia Robert se livre à des confidences et celles-ci sont espionnées par des gamines qui ont percé un trou dans un mur. Elles en font profiter Joe, le personnage joué par Woody Allen qui sert ainsi à la belle ce qu'elle veut entendre et peut ainsi la séduire.

Disposer d'informations cruciales est si précieux qu'une part majeure de l'activité de renseignement repose sur cette nécessité — une autre partie consistant à diffuser de fausses informations en espérant que celles-ci seront exploitées par d'autres gouvernements qui y accordent foi. Mais il n'est pas nécessaire d'agir sur une telle échelle pour ressentir la nécessité de détenir quelques tuyaux de nature cruciale. Ainsi, dans un jeu vidéo, être informé du point faible d'un monstre que l'on doit affronter peut faire la différence entre la victoire ou le game over.

En réalité, le Web est un méga-réservoir de données et qui plus est, en mutation permanente. Or, le propre de celles-ci est qu'elles échappent souvent à l'analyse rationnelle. Certains sites tels que Google Trends nous indiquent par exemple les tendances du moment. Ainsi, lors de la journée où ont été écrites ces lignes, alors que le sujet de jour aurait semblé être le vote d'une motion de censure à l'Assemblée, fort curieusement, c'est le mot « printemps » qui cristallisait le plus la curiosité des internautes.

Les thèmes les plus ...
[Courte citation de 8% de l'article original]