2026-04-08 14:32:30

El nuevo modelo de Anthropic duplicó Opus 4.6 en un benchmark. Vista previa de Claude Mythos — solo por invitación, sin API pública. Los números de su Tarjeta del Sistema:

- SWE-bench Verificado: 93.9% vs 80.8% (Opus) vs 79.6% (Sonnet)
- SWE-bench Pro: 77.8% vs 53.4%
- Terminal-Bench 2.0: 82.0% vs 65.4%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.