Créez un chatbot RAG à partir de zéro en environ 40 lignes de Python

DEV - 12/06

Les grands modèles de langage se trompent en toute confiance sur tout ce sur quoi ils n'ont pas été formés : votre...

Les grands modèles de langage se trompent en toute confiance sur tout ce sur quoi ils n'ont pas été formés : vos documents internes, les notes de version de la semaine dernière, ce produit de niche que vous avez créé. RAG (Retrieval-Augmented Generation) est la solution. Au lieu d'affiner le texte, vous récupérez le texte pertinent au moment des questions et le transmettez au modèle comme contexte.

Dans ce didacticiel, nous allons créer un petit mais réel chatbot RAG qui répond aux questions sur une base de connaissances privée. Pas de cadres lourds, vous pouvez donc voir chaque pièce mobile. À la fin, vous disposerez d’environ 40 lignes de Python que vous pourrez pointer vers vos propres données.

Comment fonctionne RAG

L'ensemble du pipeline comprend cinq étapes :

vos documents --> morceau --> intégrer --> stocker | question --> intégrer --> recherche ------+--> meilleures correspondances --> LLM --> réponseEntrer en mode plein écran Quitter le mode plein écran

En termes simples : vous divisez vos documents en morceaux, transformez chaque morceau en un vecteur (une intégration) et les conservez. Lorsqu'une question arrive, vous l'intégrez également, recherchez les morceaux dont les vecteurs sont les plus proches et collez ces morceaux dans l'invite afin que le modèle réponde à partir d'informations réelles au lieu de deviner.

Installation

Vous avez besoin de Python 3.9 ou plus récent et de trois packages :

pip installe des transformateurs de phrases numpy anthropiquesEntrer en mode plein écran Quitter le mode plein écran

Les intégrations s'exécuteront localement viatransformateurs de phrases, cette partie est donc gratuite et ne nécessite aucune clé API. Le seul appel API est la génération ...
[Courte citation de 8% de l'article original]

Tags : ai - python - tutoriel - apprentissage automatique - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/markofrei919/build-a-rag-chatbot-from-scratch-in-about-40-lines-of-python-i0c
Lien original, consulter l'article dans son intégralité ici : https://dev.to/markofrei919/build-a-rag-chatbot-from-scratch-in-about-40-lines-of-python-i0c
Lien direct sur notre site : http://www.newsexplorer.fr/article/32546971/Cr%C3%A9ez-un-chatbot-RAG-%C3%A0-partir-de-z%C3%A9ro-en-environ-40-lignes-de-Python
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.