Avec DiffusionGemma, Google optimise l'inférence locale - Le Monde Informatique

Article rédigé par Taryn Plumb, ComputerWorld (adapté par Jean Elyan) - Le Monde Informatique - 15/06

Plutôt que de générer du texte mot à mot, le modèle ouvert expérimental de Google s'appuie sur la technique de diffusion servant pour la création...

Les grands modèles de langage (LLM), extrêmement puissants, fonctionnent encore comme s'ils tapaient sur un clavier, traitant les charges de travail de manière simple et bidirectionnelle (propre aux transformers). Mais dans un usage local, ce traitement peut entraîner une sous-utilisation des GPU ou des TPU. Dans ce cadre, Google vient de présenter DiffusionGemma, un modèle ouvert expérimental de la famille Gemma 4. Il est capable de générer du contenu « exceptionnellement vite », en créant des blocs de texte entiers simultanément grâce à des techniques de diffusion plutôt qu'à un traitement token par token.

L'entreprise affirme que grâce à cette technique, l’inférence est quatre fois plus rapide par rapport aux autres modèles qui reposent sur un traitement séquentiel. Elle peut également se traduire par des économies pour les utilisateurs. Selon l'analyste tech...
[Courte citation de 8% de l'article original]

Source et Copyright images et textes : Article rédigé par Taryn Plumb, ComputerWorld (adapté par Jean Elyan) - Le Monde Informatique
Lien original, consulter l'article dans son intégralité ici : https://www.lemondeinformatique.fr/actualites/lire-avec-diffusiongemma-google-optimise-l-inference-locale-100450.html
Lien direct sur notre site : http://www.newsexplorer.fr/article/32587860/Avec-DiffusionGemma--Google-optimise-l%27inf%C3%A9rence-locale---Le-Monde-Informatique
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.