Anthropic a confirmé : ils testent un nouveau modèle de niveau "Step change".


Code nommé Mythos, nom de code interne Capybara. La fuite est accidentelle, mais le modèle est réel.
Comment se sont exprimés leurs précédentes annonces d'IA ? "Amélioration de X% sur le benchmark XX", "Plus rapide et moins cher", "Supporte un contexte plus long".
Et la description de Mythos ? "Une capacité de cybersécurité bien supérieure à celle de tout autre modèle d'IA", "Préfigurant une vague de modèles capables d'exploiter des vulnérabilités bien au-delà des méthodes des défenseurs".
Vous voyez la différence ?
Avant, c'était "nous sommes meilleurs". Cette fois, c'est "nous sommes si puissants que cela pourrait poser un risque".
Anthropic a toujours été la société la plus forte en narration sur la sécurité de l'IA. Leur RSP (Responsible Scaling Policy) consiste essentiellement à se limiter eux-mêmes — si la capacité du modèle dépasse un certain seuil, ils doivent ajouter des mesures de sécurité avant de le publier.
Mythos pourrait être le premier modèle à déclencher réellement une revue de sécurité de haut niveau.
Anthropic pourrait être très prudent à court terme : "Accès anticipé pour un nombre limité de clients" + "Focalisé sur la défense de la cybersécurité". Ce n’est pas une sortie grand public à grande échelle.
À long terme, la courbe de capacité de l’IA pourrait ne pas être linéaire. "Step change" signifie un saut — passer du modèle précédent à celui-ci n’est pas une amélioration de 10 %, c’est une transformation qualitative.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler