Créez un chatbot RAG à partir de zéro en environ 40 lignes de Python

DEV - 12/06
Les grands modèles de langage se trompent en toute confiance sur tout ce sur quoi ils n'ont pas été formés : votre...

Les grands modèles de langage se trompent en toute confiance sur tout ce sur quoi ils n'ont pas été formés : vos documents internes, les notes de version de la semaine dernière, ce produit de niche que vous avez créé. RAG (Retrieval-Augmented Generation) est la solution. Au lieu d'affiner le texte, vous récupérez le texte pertinent au moment des questions et le transmettez au modèle comme contexte.

Dans ce didacticiel, nous allons créer un petit mais réel chatbot RAG qui répond aux questions sur une base de connaissances privée. Pas de cadres lourds, vous pouvez donc voir chaque pièce mobile. À la fin, vous disposerez d’environ 40 lignes de Python que vous pourrez pointer vers vos propres données.

Comment fonctionne RAG

L'ensemble du pipeline comprend cinq étapes :

vos documents --> morceau --> intégrer --> stocker | question --> intégrer --> recherche ------+--> meilleures correspondances --> LLM --> réponse
Entrer en mode plein écran Quitter le mode plein écran

En termes simples : vous divisez vos documents en morceaux, transformez chaque morceau en un vecteur (une intégration) et les conservez. Lorsqu'une question arrive, vous l'intégrez également, recherchez les morceaux dont les vecteurs sont les plus proches et collez ces morceaux dans l'invite afin que le modèle réponde à partir d'informations réelles au lieu de deviner.

Installation

Vous avez besoin de Python 3.9 ou plus récent et de trois packages :

pip installe des transformateurs de phrases numpy anthropiques
Entrer en mode plein écran Quitter le mode plein écran

Les intégrations s'exécuteront localement viatransformateurs de phrases, cette partie est donc gratuite et ne nécessite aucune clé API. Le seul appel API est la génération ...
[Courte citation de 8% de l'article original]

Loading...