Certains analystes étrangers estiment que la série OpenAI « o » favorisera grandement le développement technologique en introduisant un raisonnement étendu. Et cela aidera Microsoft à bénéficier de la vague de l’IA sur le long terme.
Auteur : Idées d'investissement simples
Du passage unique à l'inférence étendue
Les modèles d'IA générative traditionnels, tels que GPT-4, génèrent des réponses en un seul passage ; ils reçoivent une invite, la traitent et produisent une réponse sans revoir ni modifier le raisonnement initial. Bien que cette approche « en un seul passage » fonctionne bien pour les requêtes simples, elle n'est souvent pas suffisante lorsqu'il s'agit de problèmes complexes en plusieurs étapes qui nécessitent une réflexion logique plus approfondie.
La série « o » d'OpenAI révolutionne ce paradigme en introduisant l'inférence étendue, une méthode dans laquelle un modèle effectue plusieurs étapes de raisonnement itératif avant de finaliser une réponse. Ceci est réalisé grâce au CoT (Chained Reasoning), qui décompose en interne le problème en sous-étapes plus petites et plus gérables. Si le modèle détecte des incohérences et des erreurs dans son raisonnement initial, il peut revenir en arrière et réviser sa logique jusqu'à ce qu'il trouve une solution cohérente et précise. En fait, plus nous demandons à ces modèles de faire des inférences étendues, plus les réponses deviennent généralement précises.
Si cette méthode est analogue à celle des humains, le célèbre scientifique Einstein en est un bon exemple. Développer la théorie de la relativité n’était pas une « avancée » de la part d’Einstein, qui n’a pas proposé la théorie dans les 1 000 premiers mots qui lui sont venus à l’esprit. Au lieu de cela, Einstein a probablement passé plusieurs années à réfléchir et à réviser ses idées avant de proposer sa théorie révolutionnaire de la relativité. Cette façon de penser longue et réfléchie ressemble davantage à la façon dont les modèles de la série « o » fonctionnent en utilisant un « raisonnement étendu ».
L’aspect le plus fascinant du raisonnement étendu est que les chercheurs d’OpenAI n’ont toujours pas trouvé de limite à la durée pendant laquelle ces modèles d’inférence peuvent s’engager dans un raisonnement étendu avant d’atteindre un plateau. Cela est intuitif car cela ressemble à la façon dont les humains trouvent généralement de meilleures réponses après avoir « réfléchi » pendant une longue période ou, dans le cas des modèles, effectuent un « raisonnement étendu ». En pratique, demander au modèle d’effectuer une inférence étendue pendant une seconde produit de pires résultats que de demander au modèle de réfléchir pendant une minute. De même, demander à un modèle de réfléchir pendant une minute produira de pires rés...
[Courte citation de 8% de l'article original]