Qwen 3.6 27B Dense modelo atinge 40 tok/seg no RTX 3090

robot
Geração do resumo em andamento

AIMPACT mensagem, 24 de abril de 2026 (UTC+8), o usuário @sudoingX publicou os resultados preliminares de teste: o modelo denso Qwen 3.6 27B em uma única placa RTX 3090 de 24GB, atingiu uma velocidade de 40 tok/s em um teste 10/10. O resultado não utilizou técnicas de quantização ou núcleos de fusão, apenas a quantização direta Q4_K_M do llama.cpp. O usuário também escreveu um teste de benchmark de enxame de partículas para avaliar o modelo. (Fonte: InFoQ)

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar