News | Gate.com

Hoje

06:07

Os modelos chineses caíram para fora do top 10 no último SWE-rebench e foram ridicularizados por "inflacionar pontuações", desta vez ocupando quatro posições.

O SWE-rebench é um benchmark de tarefas de engenharia de software em tempo real. A atualização mais recente do ranking cancelou restrições de demonstração e operação, e adicionou novas tarefas de avaliação auxiliar. O Claude Opus 4.6 ficou em primeiro lugar com 65,3%, o GLM-5 ficou em terceiro com 62,8%, e quatro modelos chineses entraram no top 10, demonstrando o progresso dos modelos chineses.

Mais

05:55

SWE-rebench Ranking mais recente: Modelos de IA chineses ocupam os primeiros catorze lugares, GLM-5 é o terceiro classificado

Classificações e tabelas de classificação

23 de março, o SWE-rebench divulgou o último ranking de testes de referência, com Claude Opus 4.6 em primeiro lugar. Esta atualização removeu demonstrações de exemplos e limites de passos, adicionando novas tarefas de avaliação assistida. GLM-5 ficou em terceiro lugar entre os modelos de código aberto, com modelos chineses ocupando quatro posições no total.

Mais

04:41

GLM-5 obteve um retorno de 42,99% na competição de previsão de mercado de IA, tornando-se o único a superar o modelo de referência humano

Mercados de previsão

O responsável global da Zhipu Z.ai, Li Zixuan, revelou que o GLM-5 lidera com uma taxa de retorno de 42.99% no mercado de previsão Prediction Arena, superando o referencial humano e tornando-se o único modelo de IA a transcender os humanos. O modelo executou 98 operações, demonstrando um desempenho excepcional.

Mais

01:27

Responsável da Zhipu anuncia que o GLM-5.1 será de código aberto

Progresso do projeto

Gate News notícia, 21 de março, Li Zixuan, responsável global da Zhipu Z.ai, publicou uma mensagem na plataforma X afirmando: «Don't panic. GLM-5.1 will be open source.» (Não se preocupem, GLM-5.1 será de código aberto.) Atualmente, ainda não foram divulgados a data de lançamento e os detalhes específicos do modelo.

Mais

02:57

Zhipu AI lançou o modelo GLM-5-Turbo, com velocidade aumentada 2-3 vezes e preço da API aumentado 20%

A Zhipu AI lançou o modelo GLM-5-Turbo a 16 de março, como versão otimizada de alta velocidade do GLM-5, personalizada especificamente para cenários de agente OpenClaw. O modelo oferece uma melhoria de velocidade de 2 a 3 vezes, suporta contexto de 200K e saída máxima de 128K, com otimizações na estabilidade de chamadas de ferramentas e outros aspetos. Nos testes de avaliação, apresentou desempenho significativamente superior ao GLM-5, com aumentos simultâneos nos preços da API e lançamento de planos de subscrição para utilizadores individuais.

Mais

11:16

Tencent Cloud Modelo Híbrido de Yuan a partir de 13 de março de 2024, aumento de preços significativo, com um aumento máximo de mais de 460%

Tencent Cloud anuncia que a partir de 13 de março irá ajustar a estratégia de cobrança de alguns modelos na plataforma de desenvolvimento de agentes inteligentes, com um aumento significativo nos preços da série HY2.0. Ao mesmo tempo, os modelos GLM 5, MiniMax 2.5 e Kimi 2.5 deixarão de estar em fase de testes públicos gratuitos e passarão a ser pagos. Os utilizadores de planos podem deduzir parte das despesas.

Mais