Le prochain pas en avant dans RAG n’est pas un meilleur modèle – c’est une meilleure récupération

DEV - 01/03
Au cours des deux dernières années, la plupart des systèmes de génération augmentée par récupération (RAG) ont suivi le même processus...

Au cours des deux dernières années, la plupart des systèmes de génération augmentée de récupération (RAG) ont suivi la même architecture :

Chunk → Intégrer → Stocker dans la base de données vectorielle → Recherche de similarité → Injecter dans LLM
Entrer en mode plein écran Quitter le mode plein écran

Ce pipeline fonctionne.

Mais il présente également une limite fondamentale :

La similarité n’est pas toujours synonyme de pertinence.

Et c’est là que commence la prochaine évolution de RAG.

Le problème principal du RAG vectoriel

Le RAG traditionnel repose sur les plongements et la similarité des vecteurs. L'hypothèse est simple :

Si deux morceaux de texte sont sémantiquement similaires dans l’espace vectoriel, ils sont pertinents.

Dans les systèmes ...
[Courte citation de 8% de l'article original]

Loading...