Des nouvelles ont été ajoutées en tête de listes.
Remontez pour les voir.
Inscription à la newsletter
Mythos, boîte de Pandore ou mystification ? - INCYBER NEWS
Meliss@11 - InCyber -
27/04
Une IA si puissante qu’elle peut hacker toute seule et ne saurait donc être diffusée au grand public. Avec Claude Mythos, Anthropic a frappé un grand coup… au moment même où elle cherche à séduire investisseurs et partenaires techniques. Derrière un emballement très (trop ?) opportun, quels sont les réels dangers de Mythos ? INCYBER fait le point.
Une IA si puissante qu’elle peut hacker toute seule et ne saurait donc être diffusée au grand public. Avec Claude Mythos, Anthropic a frappé un grand coup… au moment même où elle cherche à séduire investisseurs et partenaires techniques. Derrière un emballement très (trop ?) opportun, quels sont les réels dangers de Mythos ? INCYBER fait le point.
Trop puissante, trop autonome, trop dangereuse : à peine Anthropic dévoilait-elle Claude Mythos Preview début avril, qu’elle tentait de refermer la boîte de Pandore : pas de diffusion publique, mais un accès restreint via le Project Glasswing. Elle ne dévoilait pas un nouveau modèle d’IA performant en cybersécurité, elle mettait en scène une rupture technologique, suscitant aussitôt un buzz mondial. Un crime trop parfait pour être vrai ?
Sur le fond, pourtant, quelque chose a changé. Avec 100 % de succès, Claude Mythos sature les benchmarks Cybench, référence académique dans le milieu. Mieux, sur des exercices de l’UK AI Security Institute (AISI), plus complexes et gradués de « débutant » à « expert », il « a un taux de réussite de 73 % » au niveau expert, souligne l’AISI. Ce n’est pas un score spectaculaire en soi, sauf quand on se souvient que ces tâches étaient hors de portée des modèles il y a encore un an. Et encore, il ne s’agit là que d’exercices de type capture-the-flag : l’IA doit trouver une faille et récupérer un flag, une preuve de succès, soit des exercices cyber isolés.
Si, toujours selon l’AISI, Mythos « représente un progrès par rapport aux modèles de pointe précédents », c’est à cause de son succès dans le scénario The Last Ones... [Courte citation de 8% de l'article original]
Loading...
🍪
Le modèle économique de notre site repose sur l'affichage de publicités personnalisées basées sur l'utilisation de cookies publicitaires. En continuant votre visite sur notre site, vous consentez à l'utilisation de ces cookies.
Politique de confidentialité