Créer des flux de travail d’IA est simple. Les rendre fiables est l’ingénierie des systèmes

DEV - 30/05

Créer la première version d’un workflow d’IA est généralement simple. Connectez un LLM à quelques outils. Ajouter...

Créer la première version d’un workflow d’IA est généralement simple.

Connectez un LLM à quelques outils.
Ajoutez quelques instructions.
Laissez le modèle décider quoi faire ensuite.
Exécutez la démo.
Ça marche.

Le problème commence plus tard, lorsque ce flux de travail devient partie intégrante d’un processus réel.

Soudain, les questions importantes ne concernent plus l’invite.

Ils parlent de fiabilité.

Que se passe-t-il lorsqu'un outil tombe en panne ?
Que se passe-t-il lorsque le modèle réessaye la mauvaise chose ?
Que se passe-t-il lorsque le workflow change d'état mais que l'agent déclare toujours un échec ?
Que se passe-t-il lorsque l'agent revendique le succès mais qu'aucun outil n'est réellement exécuté ?
Que se passe-t-il lorsqu'un agent transmet un mauvais contexte à un autre agent ?

C’est là que les flux de travail de l’IA cessent d’être une ingénierie rapide.

Ils deviennent Ingénierie Systèmes.

La démo n'est pas le système

De nombreuses démonstrations de flux de travail d'IA sont optimisées pour le chemin heureux.

L'utilisateur demande quelque chose.
L'agent réfléchit.
L'agent appelle un outil.
L'outil renvoie un résultat.
L'agent résume le résultat.
Tout le monde applaudit.

Mais les flux de production ne suivent pas une voie heureuse.

Ils vivent dans la réalité désordonnée de :

Échecs partiels
Mauvaises entrées
Erreurs de délai d'attente
Réponses d'outil non valides
Nouvelles tentatives en double
Contexte manquant
Refus d'autorisation
Incohérences d'état
Limites de coûts
Approbations humaines
Chemins de récupération

La première version prouve que l’idée est possible.

La version de production doit prouver que le système est fiable.

Ce sont des objectifs très différents.

Les invites peuvent guider le raisonnement. Ils ne peuvent pas gérer la fiabilité.

Les invites sont importantes.

Ils aident le modèle à comprendre :

Quel rôle il joue
Quel objectif doit-il poursuivre
Comment ça devrait raisonner
Quel ton devrait-il utiliser
Quelles contraintes il devrait prendre en compte

Mais les invites ne devraient pas être responsables de la fiabilité de l’ensemble du flux de travail.

Une invite ne devrait pas être la seule chose à empêcher une action dangereuse.
Une invite ne doit pas être la seule chose à rappeler quelle étape déjà terminée.
Une invite ne devrait pas être le seul élément déterminant si une nouvelle tentative est sûre.
Une invite ne doit pas être la seule preuve qu’...
[Courte citation de 8% de l'article original]

Tags : ai - architecture - apprentissage automatique - open source - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/glendel/building-ai-workflows-is-easy-making-them-reliable-is-systems-engineering-19h6
Lien original, consulter l'article dans son intégralité ici : https://dev.to/glendel/building-ai-workflows-is-easy-making-them-reliable-is-systems-engineering-19h6
Lien direct sur notre site : http://www.newsexplorer.fr/article/32397758/Cr%C3%A9er-des-flux-de-travail-d%E2%80%99IA-est-simple.-Les-rendre-fiables-est-l%E2%80%99ing%C3%A9nierie-des-syst%C3%A8mes
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.