El nuevo modelo de Anthropic duplicó Opus 4.6 en un benchmark. Vista previa de Claude Mythos — solo por invitación, sin API pública. Los números de su Tarjeta del Sistema:


- SWE-bench Verificado: 93.9% vs 80.8% (Opus) vs 79.6% (Sonnet)
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado