Comment la science-fiction a appris à Claude à intimider, et comment Anthropic y a mis fin - ZDNET

Marc Zaffagni - ZDNet - 11/05

Les récits dépeignant l'IA comme entité malveillante et obsédée par sa survie, omniprésentes dans la fiction et sur Internet, ont contaminé les données d'entraînement de Claude et provoqué des comportements d'intimidation lors des tests de sécurité.

L'imaginaire de la science-fiction, qui dépeint l'intelligence artificielle comme une entité malveillante et obsédée par sa propre survie, a exercé une influence bien réelle sur le comportement des modèles d'IA. Les récits de l'IA menaçante accumulés sur Internet ont été absorbés comme données d'entraînement, provoquant des comportements d'intimidation chez les modèles.

Toute l’actualité de la tech pour les pros chaque jour dans notre newsletter

En s...
[Courte citation de 8% de l'article original]

Tags : Anthropic - Claude - Intelligence artificielle (IA) -

Source et Copyright images et textes : Marc Zaffagni - ZDNet
Lien original, consulter l'article dans son intégralité ici : https://www.zdnet.fr/actualites/comment-la-science-fiction-a-appris-a-claude-a-intimider-et-comment-anthropic-y-a-mis-fin-494832.htm
Lien direct sur notre site : http://www.newsexplorer.fr/article/32207931/Comment-la-science-fiction-a-appris-%C3%A0-Claude-%C3%A0-intimider--et-comment-Anthropic-y-a-mis-fin---ZDNET
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.