Resultados da pesquisa por "GLM"
Hoje
06:07

Os modelos chineses caíram para fora do top 10 no último SWE-rebench e foram ridicularizados por "inflacionar pontuações", desta vez ocupando quatro posições.

O SWE-rebench é um benchmark de tarefas de engenharia de software em tempo real. A atualização mais recente do ranking cancelou restrições de demonstração e operação, e adicionou novas tarefas de avaliação auxiliar. O Claude Opus 4.6 ficou em primeiro lugar com 65,3%, o GLM-5 ficou em terceiro com 62,8%, e quatro modelos chineses entraram no top 10, demonstrando o progresso dos modelos chineses.
Mais
05:55

SWE-rebench Ranking mais recente: Modelos de IA chineses ocupam os primeiros catorze lugares, GLM-5 é o terceiro classificado

23 de março, o SWE-rebench divulgou o último ranking de testes de referência, com Claude Opus 4.6 em primeiro lugar. Esta atualização removeu demonstrações de exemplos e limites de passos, adicionando novas tarefas de avaliação assistida. GLM-5 ficou em terceiro lugar entre os modelos de código aberto, com modelos chineses ocupando quatro posições no total.
Mais
02:57

Zhipu AI lançou o modelo GLM-5-Turbo, com velocidade aumentada 2-3 vezes e preço da API aumentado 20%

A Zhipu AI lançou o modelo GLM-5-Turbo a 16 de março, como versão otimizada de alta velocidade do GLM-5, personalizada especificamente para cenários de agente OpenClaw. O modelo oferece uma melhoria de velocidade de 2 a 3 vezes, suporta contexto de 200K e saída máxima de 128K, com otimizações na estabilidade de chamadas de ferramentas e outros aspetos. Nos testes de avaliação, apresentou desempenho significativamente superior ao GLM-5, com aumentos simultâneos nos preços da API e lançamento de planos de subscrição para utilizadores individuais.
Mais
11:16

Tencent Cloud Modelo Híbrido de Yuan a partir de 13 de março de 2024, aumento de preços significativo, com um aumento máximo de mais de 460%

Tencent Cloud anuncia que a partir de 13 de março irá ajustar a estratégia de cobrança de alguns modelos na plataforma de desenvolvimento de agentes inteligentes, com um aumento significativo nos preços da série HY2.0. Ao mesmo tempo, os modelos GLM 5, MiniMax 2.5 e Kimi 2.5 deixarão de estar em fase de testes públicos gratuitos e passarão a ser pagos. Os utilizadores de planos podem deduzir parte das despesas.
Mais