D’innombrables données sont collectées en permanence par des outils de mesure de toutes sortes, et le problème d’exploiter de tels réservoirs d’information se pose quotidiennement. Qu’il s’agisse de recommander un achat précis sur une boutique en ligne en se fondant sur l’historique de millions d’internautes ou bien d’agréger les données issues de capteurs météo, la bibliothèque NumPy s’est peu à peu imposée comme l’outil privilégié des analystes…
L’un des atouts de Python réside dans la présence d’un vaste ensemble de bibliothèques associées à ce langage de programmation. La communauté de développeurs qui s’est formée autour de Python amène à profiter des apports des uns et des autres et il en résulte des écosystèmes d’une incroyable richesse. Originellement dédiée au calcul scientifique mais exploitée bien au-delà du monde de la recherche, NumPy est un bon exemple d’outil savamment pensé qui conserve néanmoins l’accessibilité propre à Python.
Qu'est-ce que NumPy ?
NumPy est une bibliothèque du langage de programmation Python, dédiée au calcul sur des tableaux (en anglais, arrays), soit de vastes volumes de chiffres. Cette bibliothèque propose des représentations « standard » de données numériques tabulées.
Les structures de données de Python
Par nature, Python fournit de riches outils de structures de données :
- les « tuples », c'est-à-dire des séquences d’éléments hétérogènes immuables (on ne peut les mettre à jour) ;
- les ensembles (sets) qui sont des collections non ordonnées d’objets uniques et immuables ;
- les listes pour énumérer des collections d’objets ordonnées ;
- les intervalles (range), ce sont des séquences avec une valeur d’arrivée obligatoire et qui peuvent aussi intégrer une valeur de départ et une valeur de pas ;
- des dictionnaires où l’on s’associe des clés (keys) uniques et immuables à des valeurs (values) susceptibles d’évoluer...
Il reste que de telles structures ne sont pas idéales pour les calculs à haute performance. NumPy a donc été créé dans un tel but : faciliter les opérations rapides sur des tableaux volumineux.
Comment NumPy a-t-il été créé ?
C’est un chercheur américain, Travis Oliphant, qui a créé NumPy au début des années 2000, avec pour objectif de définir une structure de données facilitant le calcul sur les tableaux.
L’ambition de Oliphant était de pouvoir marier deux bibliothèques de calcul apparues auparavant :
- Numeric, qui avait été créé e...
[Courte citation de 8% de l'article original]