Scaleway rejoint la liste des partenaires d'inférence de la plateforme Hugging Face.
Le fournisseur cloud a annoncé vendredi dernier que ses services peuvent maintenant être sélectionnés par les utilisateurs de la plateforme Hugging face pour "exécuter de l'inférence serverless directement sur les modèles hébergés par Hugging Face."
La société précise dans son communiqué que cette possibilité peut être réalisée en utilisant le routage de Hugging Face, ou en utilisant leurs clefs API Scaleway. La facturation est comptabilisée en fonction du nombre de tokens, et permet d'avoir recours à plusieurs modèles américains type Llama de Meta, GPT d'OpenAI ou encore Qwen ou Deepseek tout en conservant les données sur un cloud européen.
La société espère que cette option pourra attirer les utilisateurs de la plateforme soucieux de leur conformité "en permettant aux développeurs d’exécuter de l’inférence sur un cloud européen conforme aux standards et réglementations locales." L'approche permet en effet de s'assurer que les données envoyées au modèle ...
[Courte citation de 8% de l'article original]