Implémentation de RAG avec LangChain

DEV - 07/12

La génération augmentée de récupération (RAG) est un processus par lequel nous augmentons la connaissance du grand langage...

La génération augmentée de récupération (RAG) est un processus dans lequel nous augmentons la connaissance du grand modèle linguistique (LLM). Les LLM réguliers sont formés sur des ensembles de données spécifiques et les connaissances de ces LLM sont interrompues à un moment donné.

RAG permet l'introduction d'informations supplémentaires basées sur des connaissances dans un LLM pour fournir des informations plus précises, actuelles ou spécifiques.

Comment fonctionne RAG

RAG fonctionne en récupérant les informations pertinentes d'une base de données à l'aide d'une requête générée par le LLM. Ces informations sont ensuite ajoutées aux entrées du LLM, l'aidant à produire des réponses plus précises et plus contextuelles.

Le processus de récupération repose généralement sur un moteur de recherche sémantique, qui utilise des intégrations stockées dans des bases de données vectorielles ainsi qu'un classement avancé et une réécriture de requêtes pour garantir que les résultats correspondent à la requête et répondent aux besoins de l'utilisateur.

Concepts

Indexage

L'indexation est le processus de collecte et de chargement de données à partir d'une source et de leur traitement pour une utilisation ultérieure.

Voici les étapes utilisées pour l'indexation des données

Charger/extraire des données : nous devons charger les données à partir d'une source externe telle qu'une base de données, des fichiers locaux, des pages Web, une API, etc. LangChain utilise Document Loader pour ce processus.
Fractionner : nous divisons les données en morceaux plus petits à l'aide de séparateurs de texte. Cette étape est nécessaire pour permettre à LLM de récupérer et de traiter les données plus efficacement. Par exemple, le modèle OpenAI GPT a un nombre limité de jetons qu'ils peuvent traiter en une seule entrée (par exemple 4 000 à 1 600 jetons). Le fractionnement des documents garantit que les morceaux restent dans ces limites de jetons, permettant un traitement efficace sans troncature ni erreurs.
Store : après avoir découpé le document, les fractionnements sont stockés et indexés pour la recherche. Ceci est accompli à l'aide d'un magasin vectoriel et d'un modèle d'intégration. LangChain fournit la fonctionnalité VectorStore et l'intégration avec divers textes [Modèles d'intégration.]

Image fournie par le site Web de LangChain

Récupération et génération

Récupération : Le système utilise les entrées de l'utilisateur pour rechercher et récupérer les enregistrements/fractionnements associés dans le magasin.
Génération : un LLM combine les entrées de l'utilisateur avec les informations récupérées, en intégrant des données externes à ses données de formation.

Image fournie par le site Web de LangChain

Aperçu rapide

La mise en œuvre de RAG (Retrieval-Augmented Generation) implique le chargement de documents à partir de sources externes, qui sont ensuite affinés via des processus tels que le fractionnement ou le segmentage. Chaque morceau est intégré et stocké dans une base de données vectorielles pour permettre une recherche et une récupération efficaces.

Pendant la phase de récupération et de génération, les enregistrements pertinents sont extraits de la base de données vectorielles. Ces morceaux récupérés sont combinés avec l'invite de l'utilisateur et traités par le modèle de langage. Le LLM génère une sortie qui intègre la requête de l'utilisateur, les données augmentées et ses connaissances pré-entraî...
[Courte citation de 8% de l'article original]

Tags : ai - langchain - llm - webdev - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/bolajibolajoko51/rag-implementation-with-langchain-2jei
Lien original, consulter l'article dans son intégralité ici : https://dev.to/bolajibolajoko51/rag-implementation-with-langchain-2jei
Lien direct sur notre site : http://www.newsexplorer.fr/article/23115166/Impl%C3%A9mentation-de-RAG-avec-LangChain
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.