Intégrez Llama3 dans votre application avec une seule commande !

DEV - 25/04

Llama3, présenté comme le premier « GPT4 open source » au monde, est enfin arrivé ! Llama3, le dernier...

Llama3, présenté comme le premier « GPT4 open source » au monde, est enfin arrivé !

Llama3, le dernier Large Language Model (LLM) open source lancé par Meta, comprend le Llama3 8B avec 8 milliards de paramètres et le Llama3 70B avec 70 milliards de paramètres. Llama3 a fait des progrès significatifs en termes de performances, le modèle 8B surpassant Gemma 7B et Mistral 7B Instruct dans divers benchmarks tels que MMLU, GPQA, HumanEval, tandis que le modèle 70B a surpassé le Sonnet propriétaire Claude 3 et est à égalité avec Gemini Pro 1.5 de Google. . De plus, Meta développe une version avec plus de 400 milliards (400 milliards) de paramètres, qui devrait avoir des capacités de traitement multilingues améliorées et la capacité de comprendre des modèles non textuels tels que des images.

Avec Llama3 à notre disposition, nous pouvons créer une gamme d'applications innovantes, des chatbots attrayants aux robots d'assurance qualité intelligents de récupération augmentée (RAG), et au-delà. Cependant, déployer Llama3, intégrer le Llama3 déployé à son application et déployer l'application elle-même peut être un défi pour de nombreux développeurs.

Cet article présente une approche de développement basée sur Pluto, qui nécessite uniquement l'écriture du code de l'application et l'exécution d'une seule commande pour déployer Llama3 et publier l'application. Cet article utilisera un robot d'assurance qualité de documents basé sur RAG comme exemple pour démontrer cette méthode de développement. La fonction principale de ce robot QA est de récupérer la documentation du projet à partir d'un référentiel GitHub spécifié, puis d'utiliser le modèle Llama3 pour répondre aux questions basées sur le contenu du document.

L'image suivante montre l'interaction avec ce robot QA, le référentiel spécifié étant le référentiel de documentation de Pluto. Ainsi, à partir du contenu de l’image, on peut avoir une compréhension de base de ce qu’est Pluton :

Architecture des applications

L'exemple d'application à implémenter est basé sur le framework LangChain et utilise OpenAI Embeddings comme outil de vectorisation de documents. L'intégralité de l'application sera déployée sur AWS, et l'architecture déployée est présentée dans la figure ci-dessous :

Plus précisément, l'application déployée comprendra les instances de ressources AWS suivantes :

Le modèle Llama3 sera déployé sur SageMaker.
Un compartiment S3 sera créé pour stocker la base de données vectorielles de documents, évitant ainsi d'avoir à reconstruire la base de données vectorielles à chaque démarrage d'une fonction Lambda.
Une règle CloudWatch sera créée pour mettre à jour quotidiennement la base de données vectorielles de documents.
Deux instances Lambda seront créées, l'une pour recevoir les requêtes des utilisateurs et l'autre pour mettre à jour la base de données vectorielles de documents.

En plus de créer ces instances de ressources, il est également nécessaire de configurer les dépendances entre les ressources, notamment les déclencheurs, les rôles IAM et les stratégies d'autorisation. Cependant, vous n'avez pas à vous soucier de ces processus complexes de création et de configuration, car Pluto peut déduire ces i...
[Courte citation de 8% de l'article original]

Tags : lama3 - aws - ai - webdev - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://pluto-lang.vercel.app/cookbook/rag-qa-bot-llama3
Lien original, consulter l'article dans son intégralité ici : https://pluto-lang.vercel.app/cookbook/rag-qa-bot-llama3
Lien direct sur notre site : http://www.newsexplorer.fr/article/17985601/Int%C3%A9grez-Llama3-dans-votre-application-avec-une-seule-commande%C2%A0!
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.