Qwen 3.6 27B Dense modelo atinge 40 tok/s no RTX 3090

robot
Geração do resumo em andamento

AIMPACT mensagem, 24 de abril de 2026 (UTC+8), o usuário @sudoingX publicou os resultados preliminares de teste: o modelo Qwen 3.6 27B Dense em uma única placa RTX 3090 de 24GB, passou no teste 10/10 a uma velocidade de 40 tok/s. Este resultado não utilizou técnicas de quantização ou núcleos de fusão, apenas quantização direta Q4_K_M do llama.cpp. O usuário também escreveu um teste de benchmark de enxame de partículas para avaliar o modelo. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar