Comment la science-fiction a appris à Claude à intimider, et comment Anthropic y a mis fin - ZDNET

Marc Zaffagni - ZDNet - 11/05
Les récits dépeignant l'IA comme entité malveillante et obsédée par sa survie, omniprésentes dans la fiction et sur Internet, ont contaminé les données d'entraînement de Claude et provoqué des comportements d'intimidation lors des tests de sécurité.

L'imaginaire de la science-fiction, qui dépeint l'intelligence artificielle comme une entité malveillante et obsédée par sa propre survie, a exercé une influence bien réelle sur le comportement des modèles d'IA. Les récits de l'IA menaçante accumulés sur Internet ont été absorbés comme données d'entraînement, provoquant des comportements d'intimidation chez les modèles.

Loading...