Pourquoi l'architecture de mémoire de votre agent est probablement erronée

DEV - 15/03

La plupart de la mémoire des agents utilise par défaut la recherche vectorielle. Voici une alternative à trois niveaux utilisant des fichiers simples qui fonctionne réellement en production.

Si vous avez suivi la première partie de cette série, vous disposez d'une équipe d'agents fonctionnelle avec des fichiers de mémoire persistante. Cet article explique pourquoi cette architecture de mémoire fonctionne – et pourquoi l’approche par défaut de la plupart des frameworks ne fonctionne pas.

La valeur par défaut est cassée

La plupart des frameworks d'agents traitent la mémoire comme un problème de stockage. Le conseil est familier : intégrez tout dans une base de données vectorielles, récupérez ce qui semble pertinent via une recherche de similarité, insérez-le dans la fenêtre contextuelle. RAG-tout.

Cela échoue en pratique pour une raison précise : l'agent ne contrôle pas ce dont il se souvient.

La récupération de vecteurs fait apparaître ce qui est sémantiquement similaire, et non ce qui est important à l'heure actuelle. Un agent commercial a besoin des prix actuels, des remises actives et de l’historique de ce client – et non de tous les documents mentionnant le mot « prix ». Lorsque la récupération s'appuie sur le mauvais contexte, ou lorsqu'un agent ne dispose pas de limites claires quant à ce qu'il peut ou ne peut pas dire, les échecs sont réels.

Fin 2023, le chatbot d'un concessionnaire Chevrolet a été socialement conçu pour accepter de vendre un nouveau Tahoe pour 1 $. Le mécanisme d’échec était une injection rapide – un utilisateur a demandé au robot d’ignorer ses contraintes et de confirmer l’accord – mais le problème sous-jacent était architectural. Le chatbot n’avait pas de mémoire structurée séparant les « choses sur lesquelles je peux accepter » des « choses que je devrais connaître ». Tout résidait dans une seule couche de récupération plate, et l'agent ne pouvait pas distinguer la tarification faisant autorité du contexte conversationnel.

Ce n'est pas un problème d'intelligence de modèle. C'est un problème d'architecture de l'information....
[Courte citation de 8% de l'article original]

Tags : ai - agents - architecture - programmation - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/agentteams/why-your-agents-memory-architecture-is-probably-wrong-55fc
Lien original, consulter l'article dans son intégralité ici : https://dev.to/agentteams/why-your-agents-memory-architecture-is-probably-wrong-55fc
Lien direct sur notre site : http://www.newsexplorer.fr/article/31583293/Pourquoi-l%27architecture-de-m%C3%A9moire-de-votre-agent-est-probablement-erron%C3%A9e
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.