Apple travaille avec Nvidia pour rendre l'IA plus réactive

Sina - 21/12

Récemment, Apple et NVIDIA ont annoncé une coopération pour accélérer et optimiser les performances d'inférence des grands modèles de langage (LLM).

Afin d'améliorer la faible efficacité et la faible bande passante mémoire du raisonnement LLM autorégressif traditionnel, plus tôt cette année, les chercheurs en apprentissage automatique d'Apple ont publié et open source une technologie de décodage spéculatif appelée "ReDrafter" (Recurrent Drafter, cyclic draft model).

▲Source : GitHub

Actuellement, ReDrafter a été intégré à la solution d'inférence évolutive de NVIDIA « TensorRT-LLM ». Cette dernière est une bibliothèque open source basée sur le framework de compilation d'apprentissage profond « TensorRT » conçu pour optimiser l'inférence LLM et prend en charge le décodage spéculatif, y compris la méthode « Medusa ».

Cependant, comme les algorithmes inclus dans ReDrafter utilisent des opérateurs qui n'ont jamais été utilisés auparavant, NVIDIA a ajouté de nouveaux opérateurs ou exposé ...
[Courte citation de 8% de l'article original]

Tags : raisonnement - pomme - algorithme - IA - nvidia -

Article automatiquement traduit - Source et Copyright images et textes : - Sina
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://finance.sina.com.cn/roll/2024-12-21/doc-ineafmit1517637.shtml
Lien original, consulter l'article dans son intégralité ici : https://finance.sina.com.cn/roll/2024-12-21/doc-ineafmit1517637.shtml
Lien direct sur notre site : http://www.newsexplorer.fr/article/23504786/Apple-travaille-avec-Nvidia-pour-rendre-l%27IA-plus-r%C3%A9active
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.