TinySearch : laissez les petits LLM locaux rechercher sur le Web sans graver le contexte

DEV - 29/05

J'ai beaucoup joué avec les agents LLM locaux ces derniers temps. Surtout des modèles plus petits, des outils MCP,...

J'ai beaucoup joué avec des agents LLM locaux ces derniers temps. Principalement des modèles plus petits, des outils MCP, des flux de travail de style Cline/Roo et des configurations de laboratoire à domicile.

Pas le monde du « contexte infini, budget infini ».

Plutôt :

« Ce modèle 4B/9B peut-il réellement utiliser le Web sans se laisser enterrer vivant par un contexte poubelle ?

C'était le problème qui me dérangeait.

La plupart des outils de recherche sur le Web fonctionnent techniquement, mais ils transfèrent souvent beaucoup trop de texte de page brut dans le modèle. Vous posez une question simple, et soudain, votre modèle local essaie de raisonner à travers des bannières de cookies, des démarques brisées, des remplissages SEO, des menus de navigation, des paragraphes dupliqués et cinq pages de courrier indésirable non pertinents.

Pour les petits modèles, c'est pénible.

Ils n’ont pas besoin de « tout le Web ».

Ils ont besoin d’une petite tranche du Web utile et basée sur la source qui correspond à la requête réelle.

J'ai donc construit TinySearch.

GitHub : https://github.com/MarcellM01/TinySearch

Ce que fait TinySearch

TinySearch est un petit outil de recherche MCP open source qui :

recherche sur le Web
explore les pages sélectionnées
fragmente le contenu extrait
reclasse les parties utiles
renvoie une invite compacte et basée sur la source pour votre modèle

Le flux est essentiellement :

recherche -> exploration -> reclassement -> renvoyer l'invite fondéeEntrer en mode plein écran Quitter le mode plein écran

C'est toute l'idée.

TinySearch ne répond pas lui-même à la question.

Il prépare les preuves.

Votre...
[Courte citation de 8% de l'article original]

Tags : ai - open source - mcp - chiffon - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/marcbuilds/tinysearch-let-small-local-llms-search-the-web-without-burning-context-17ic
Lien original, consulter l'article dans son intégralité ici : https://dev.to/marcbuilds/tinysearch-let-small-local-llms-search-the-web-without-burning-context-17ic
Lien direct sur notre site : http://www.newsexplorer.fr/article/32387990/TinySearch%C2%A0--laissez-les-petits-LLM-locaux-rechercher-sur-le-Web-sans-graver-le-contexte
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.