Architecture de transformateur : révolutionner la PNL

DEV - 29/09

Introduction à l'architecture du transformateur Le Transformer a été introduit dans le document de 2017,...

Introduction à l'architecture du transformateur

Le Transformer a été introduit dans l'article de 2017, « L'attention est tout ce dont vous avez besoin », par Vaswani et al. Contrairement aux réseaux de neurones récurrents (RNN) et aux réseaux de mémoire à long terme (LSTM) traditionnels, qui reposent sur un traitement séquentiel des données, le Transformer traite les données d'entrée en parallèle, ce qui le rend plus efficace et évolutif pour les grands ensembles de données.

Composants de base du transformateur

Le Transformer se compose de deux composants principaux : un encodeur et un décodeur, tous deux composés de couches identiques. L'encodeur traite les données d'entrée et le décodeur génère la sortie, généralement utilisée pour des tâches telles que la traduction ou la génération de texte.

Encodeur

Chaque encodeur du Transformer se compose de :

Mécanisme d'auto-attention : cela permet à chaque mot de se concentrer sur d'autres mots dans la phrase d'entrée, capturant ainsi les...
[Courte citation de 8% de l'article original]

Tags : llm - nlp - 75daysofllm - ai - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/nareshnishad/transformer-architecture-revolutionizing-nlp-f4h
Lien original, consulter l'article dans son intégralité ici : https://dev.to/nareshnishad/transformer-architecture-revolutionizing-nlp-f4h
Lien direct sur notre site : http://www.newsexplorer.fr/article/21557583/Architecture-de-transformateur%C2%A0--r%C3%A9volutionner-la-PNL
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.