Notícias do Coinjie.com, a equipe da PAI da Alibaba lançou e open-soube o pequeno modelo de linguagem de agente inteligente projetado especificamente para chamadas de ferramentas de nível industrial AgenticQwen (inclui versões 8B e 30B-a3b).


Essa série de modelos é treinada através de uma inovadora estrutura de aprendizado por reforço de "duplo ciclo de dados", que reduz significativamente o custo de inferência, ao mesmo tempo em que alcança capacidades de agentes inteligentes próximas a modelos de bilhões de parâmetros.
Os testes mostram que o AgenticQwen-8B obteve uma pontuação média de 47,4 em benchmarks de ambientes de ferramentas reais (como tau-2 e bfcl-v4), muito acima do Qwen3-8B de versão básica (23,8), chegando perto do Qwen3-235B (52,0).
Atualmente, esse modelo já está implantado em sistemas de produção internos semelhantes ao manus, reduzindo significativamente a diferença para o grande modelo de 235B.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar