80 % des Data Scientists opérant dans l’écosystème Python se servent de Matplotlib pour la visualisation graphiques des données. Un tel engouement est-il justifié ? Et quelles sont les alternatives ?
Bibliothèque du langage Python, Matplotlib est en mesure de représenter des données sous forme graphique (ce que l’on appelle en anglais des plots) : courbes, histogrammes, nuages de points, cartes...
Habituellement, si l’on évoque la création de graphiques à partir de données, la référence à Excel vient spontanément à l’esprit. Toutefois, la différence essentielle réside dans le facteur d’échelle. Python est en mesure d’analyser des bases de données de millions d’entrées et Matplotlib pourra en extraire une substantique moelle sous forme de graphes.
Pour mémoire, Python est un langage particulièrement prisé par les programmeurs en raison de sa facilité d’emploi mais aussi de sa versatilité. Il peut servir aussi bien à réaliser des services Web - le site Youtube.com a été réalisé à partir du langage Python – que d’aider à gérer l’administration de serveurs, favoriser la création d’applications d’Intelligence Artificielle ou servir d’outil pour la Data Science.
Comment a été créé Matplotlib ?
Matplotlib est un projet Open Source et collaboratif. Il est né de l’initiative de John Hunter en 2002. Le point original est que Hunter n’était pas un programmeur mais un chercheur en neurobiologie. C’est dans ce cadre qu’il a étudié le langage Python et a développé une bibliothèque initialement dédiée à la représentation graphique de données issues de capteurs, dans le cadre de ses propres recherches sur l’épilepsie. Par la suite, l’un des facteurs qui l’a rendu fier est que l’usage de Matplotlib par la NASA a contribué à l’atterrissage en douceur des véhicules Rover d’explo...
[Courte citation de 8% de l'article original]