AxonML - Un framework ML équivalent à PyTorch écrit en Rust

DEV - 28/02

Andrew Jewell Sr / AutomataNexus LLC Au cours de la dernière année et demie, j'ai construit AxonML --...

Andrew Jewell Sr / AutomataNexus LLC

Au cours de la dernière année et demie, j'ai construit AxonML, un framework d'apprentissage automatique dans Rust qui vise la parité des fonctionnalités avec PyTorch. Il en est maintenant à la version 0.3.2 : 22 caisses, 336 fichiers sources Rust, 1 095 tests réussis et il exécute l'inférence de production sur le matériel de pointe Raspberry Pi dans les bâtiments commerciaux. Cet article explique pourquoi je l'ai construit, comment il est architecturé, les problèmes techniques difficiles que j'ai rencontrés et où il est réellement utilisé.

GitHub : github.com/AutomataNexus/AxonML Licence : MIT / Apache-2.0

Motivation

J'ai construit tout un écosystème d'automatisation des bâtiments à partir de zéro. NexusBMS est la plate-forme centrale de gestion des bâtiments - elle a remporté un hackathon InfluxDB et exécute InfluxDB 3.0 OSS aux côtés de ma propre base de données (Aegis-DB, également open source). Les contrôleurs de bord sont plus de 50 Raspberry Pi 4/5 exécutant mon logiciel NexusEdge personnalisé : démons matériels Rust pour les communications I2C, BACnet et Modbus, contrôle direct des équipements CVC via des sorties analogiques, des triacs 24 V, des entrées 0-10 V, des entrées de thermistance 10K/1K et des entrées à contact sec. Logique de contrôle personnalisée par type d'équipement. Plus de 16 installations, dont l'Université Taylor, Element Labs, Byrna Ammunition, l'école catholique St. Jude et les établissements de retraite Heritage Point dans deux villes différentes. Plus de 120 pièces d'équipement : appareils de traitement de l'air, chaudières, tours de refroidissement, pompes, unités DOAS, unités de piscine de natatorium, ventilateurs d'extraction, serres.

La surveillance utilise l'apprentissage automatique (auto-encodeurs LSTM pour la détection des anomalies, réseaux GRU pour la prédiction des pannes) fonctionnant sur les contrôleurs Pi Edge montés dans les salles mécaniques. Les Pi 5 sont équipés de puces Hailo NPU exécutant des modèles plus grands ; Les Pi 4 exécutent des modèles d’inférence AxonML Rust plus petits.

Le plan initial était de former des modèles dans PyTorch et de déployer l'inférence en Python sur Pis. Cela n'a pas bien fonctionné. L'empreinte mémoire de Python sur un Pi de 1 Go de RAM était trop élevée. La gestion de la dépendance était fragile. La prise en charge ARM de PyTorch était incomplète. Et je passais plus de temps à lutter contre le pipeline de déploiement qu'à construire des modèles.

Je voulais un framework où je pourrais :

Définir et entraîner des modèles avec une ergonomie de type PyTorch
Compiler en un seul binaire statique
Compilation croisée vers ARM
Exécutez l'inférence avec 2 à 3 Mo de RSS sans dépendances d'exécution

Rust était le choix évident. La question était de savoir si une seule personne pouvait créer un cadre suffisamment important pour être réellement utile.

Il s’avère que la réponse est oui – avec les mises en garde que je vais aborder.

Architecture : 22 caisses

AxonML est structuré comme un espace de travail Cargo avec 22 caisses, organisées en couches. Chaque caisse est testable indépendamment et peut être intégrée via des indicateurs de fonctionnalités.

Couche 1 : Compute Foundation

axonml-corefournit une abstraction des appareils sur CPU, CUDA, Vulkan, Metal et WebGPU. LeAppareilenum distribue les opérations au backend approprié.Stockageest la mémoire brute comptée en référence pour les tenseurs. Le backend CUDA implémente l'allocation de mémoire GPU, cuBLAS GEMM pour la multiplication matricielle et plus de 20 noyaux CUDA par éléments compilés à partir de la source PTX.

axoneml-tenseurimplémente des tenseurs à N dimensions génériques sur le type scalaire :Tenseur. La diffusion suit les règles de NumPy. Les vues et les découpages sont sans copie lorsque cela est possible (soutenus parArc). Plus de 60 opérations, dont l'arithmétique, les réductions (somme, moyenne, max, min, prod), le tri (sort, argsort, topk), l'indexation (ras...
[Courte citation de 8% de l'article original]

Tags : rouille - ai - apprentissage automatique - iot - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/automatanexus/axonml-a-pytorch-equivalent-ml-framework-written-in-rust-328a
Lien original, consulter l'article dans son intégralité ici : https://dev.to/automatanexus/axonml-a-pytorch-equivalent-ml-framework-written-in-rust-328a
Lien direct sur notre site : http://www.newsexplorer.fr/article/31359397/AxonML---Un-framework-ML-%C3%A9quivalent-%C3%A0-PyTorch-%C3%A9crit-en-Rust
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.