Notícias do Coinjie.com, a nova geração do grande modelo básico da Meituan, longcat-2.0-preview, já está em fase de testes abertos, e o tamanho total de seus parâmetros ultrapassa um trilhão, colocando-o na linha de modelos grandes de elite mundial. Pessoas familiarizadas com o assunto revelaram que o novo modelo v4, lançado pela deepseek no mesmo dia, possui uma quantidade de parâmetros total e de ativação basicamente equivalente ao longcat-2.0-preview da Meituan. A maior inovação do novo grande modelo básico da Meituan é que todo o treinamento e inferência dependem de um cluster de computação doméstico. Segundo informações, a quantidade de cartões de computação utilizados na fase de treinamento da Meituan desta vez está entre 50.000 e 60.000, sendo a maior escala de treinamento de um grande modelo já realizada inteiramente com capacidade de computação doméstica.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar