Até 2027, a receita de chips de IA atingirá 1 trilião de dólares! Jensen Huang: Token é a pedra angular da era da IA, "Llama" será o sistema operacional pessoal

robot
Geração de resumo em curso

AI (Inteligência Artificial) líder em chips, Nvidia, anunciou várias atualizações importantes na GTC, com Jensen Huang afirmando que Token (tokens) é a pedra angular da era da IA.

No dia 16 de março, horário local, o CEO da Nvidia, Jensen Huang, fez seu discurso principal na conferência anual de desenvolvedores GTC. Durante mais de duas horas de apresentação, Huang revelou vários produtos, incluindo a Vera CPU dedicada à Agentic AI (IA de agentes), o processador de linguagem (LPU) Groq 3, e a nova tecnologia de renderização neural DLSS 5.

Embora Huang não tenha divulgado detalhes adicionais sobre o roteiro de produtos da empresa, ele enviou sinais bastante otimistas ao mercado. Huang prevê que, até 2027, o valor total dos pedidos de compra dos chips Blackwell e Vera Rubin da Nvidia atingirá 1 trilhão de dólares. Em outubro do ano passado, Huang afirmou que, nos próximos cinco trimestres, as vendas totais dos chips Blackwell e Rubin poderiam alcançar 500 bilhões de dólares.

Lançamento de vários chips, avanço significativo na performance de inferência da plataforma Vera Rubin

No início do discurso, Huang destacou que este ano marca o 20º aniversário do nascimento da arquitetura CUDA da Nvidia. Huang afirmou: “Levamos 20 anos construindo, globalmente, centenas de milhões de GPUs e sistemas de computação que rodam CUDA. Estamos presentes em cada nuvem, em cada empresa de computação. Servimos praticamente todos os setores.”

A ecologia da arquitetura CUDA da Nvidia. Fonte: transmissão ao vivo

Primeiro, Huang falou sobre a série de placas de vídeo de consumo GeForce, chamando-a de “a maior campanha de marketing da Nvidia” e dizendo que “pode-se dizer que a Nvidia foi fundada pela GeForce”. Ele explicou que, na época, a empresa impulsionou o desenvolvimento da tecnologia CUDA na área gráfica, estabelecendo a base para sua posição atual. As funcionalidades inicialmente desenvolvidas para GPUs GeForce acabaram desencadeando uma “explosão de IA”.

Huang então apresentou o primeiro grande lançamento do dia — a tecnologia de renderização neural DLSS 5, chamando-a de “o momento ‘GPT’ no campo gráfico”. O novo sistema DLSS 5 combina dados tradicionais de gráficos 3D com modelos de IA generativa, usando renderização neural em tempo real para infundir imagens com detalhes de iluminação e materiais de nível cinematográfico. Segundo informações, esta é a maior inovação no campo de gráficos por computador desde o lançamento do ray tracing em tempo real em 2018.

Depois, Huang mostrou o “círculo social” da Nvidia. Ele afirmou que “empresas nativas de IA” estão crescendo rapidamente, assim como na bolha da internet, quando muitas pequenas empresas se tornaram grandes players essenciais na transformação da computação de IA.

Huang enfatizou que, com a evolução das capacidades dos modelos, a demanda por poder de processamento também está crescendo rapidamente. Nos últimos dois anos, essa demanda aumentou 1 milhão de vezes. Com a chegada do “ponto de inflexão na inferência” (inference inflection), onde os modelos de IA operam na forma de agentes realizando tarefas reais, a necessidade de raciocínio e processamento de IA disparou. Atualmente, a demanda por poder de processamento é o maior gargalo.

Naquele dia, a Nvidia lançou oficialmente a plataforma de computação Vera Rubin, composta por sete chips revolucionários, uma “supercomputador revolucionário” para impulsionar agentes inteligentes. Huang afirmou que sua capacidade de computação aumentou 40 milhões de vezes em relação a uma década atrás. A plataforma integra a Vera CPU de 88 núcleos, que foi otimizada em vários aspectos em relação às CPUs x86 tradicionais: a largura de banda de memória por núcleo foi triplicada, a eficiência energética dobrou, e o desempenho em tarefas de IA aumentou cerca de 1,5 vezes.

Segundo informações, a nova geração NVL72 do sistema Vera Rubin alcançou avanços significativos na inferência, conectando 72 GPUs Rubin e 36 CPUs Vera via tecnologia NVLink 6, permitindo treinar modelos MoE (mistura de especialistas) com apenas um quarto do número de GPUs da geração anterior. Com o mesmo consumo de energia, a capacidade de inferência de IA aumentou 50 vezes, e o custo para gerar um milhão de tokens caiu cerca de 35 vezes.

Vera Rubin NVL72 se torna o “rei da inferência”. Fonte: transmissão ao vivo

Simultaneamente, a Nvidia anunciou o Groq 3 LPU, com previsão de lançamento no terceiro trimestre. Este novo processador também será integrado na plataforma Vera Rubin. Em dezembro do ano passado, a Nvidia adquiriu a equipe principal da startup de chips Groq por 20 bilhões de dólares, a maior aquisição até então.

Além disso, a Nvidia lançou a plataforma “Computação Espacial”, incluindo o módulo Space-1 Vera Rubin, IGX Thor e Jetson Orin. Huang destacou: “A computação espacial chegou ao seu auge. Com o lançamento de constelações de satélites e a exploração do espaço profundo, a inteligência precisa estar onde os dados são gerados.” Ele também mencionou que o ambiente espacial apresenta desafios diferentes, e a empresa está estudando soluções para lidar com radiação.

Lançamento do “Lobster de implantação única”, recomendando que todas as empresas preparem sua estratégia de agentes

Durante o discurso, o framework de agentes de código aberto OpenClaw (popularmente chamado de “Lobster”) se tornou uma palavra-chave. Huang enfatizou que o OpenClaw será o “sistema operacional da IA pessoal”, marcando o início de uma nova fase de revitalização do setor de software.

Huang afirmou que o OpenClaw chegou na hora certa, e que todas as empresas ao redor do mundo devem se preparar para uma “estratégia de agentes”: “Cada empresa de TI, cada SaaS (software como serviço), no futuro, será uma empresa de Geração de IA (GAS).” Assim, tokens se tornarão a base do futuro na era da IA, e todos os engenheiros precisarão consumir tokens para aumentar sua produtividade.

Para isso, a Nvidia lançou a pilha de software NemoClaw, especialmente projetada para o “Lobster”, com foco na instalação com um clique. Segundo informações, ela garante que os agentes possam ser usados com segurança, sem vazamento de dados proprietários. Os usuários podem otimizar o OpenClaw com um clique, usando o OpenShell embutido para criar ambientes isolados, garantindo privacidade de dados e segurança de rede.

A Nvidia lança a pilha de software NemoClaw. Fonte: transmissão ao vivo

Huang também anunciou a criação da aliança de modelos de código aberto Nemotron, que visa “avançar na fronteira dos modelos abertos”. Os membros incluem startups de IA como Perplexity, Reflection, Black Forest Labs, entre outras. A Nvidia também lançou uma série de famílias de modelos de código aberto para apoiar o desenvolvimento de IA de agentes, IA física e IA médica.

Huang afirmou ainda que o “momento ChatGPT” para veículos autônomos já chegou. A Nvidia anunciou parcerias com fabricantes de veículos líderes como BYD, Geely, Isuzu e Nissan, para desenvolver veículos autônomos de nível L4 baseados na plataforma Nvidia DRIVE Hyperion. A empresa também expandiu sua colaboração com Uber, planejando lançar uma frota de veículos autônomos totalmente operados pelo software Nvidia DRIVE AV em 28 cidades de quatro continentes até 2028.

Claro, Huang não esqueceu de destacar seu interesse pelo setor de robótica, afirmando que “não há nenhuma empresa de robótica que ainda não tenha colaborado com a Nvidia”. Para encerrar, um robô chamado “Sven” de “Frozen” — desenvolvido em parceria com a Disney — fez sua estreia, encerrando a conferência com uma nota futurista.

No dia 16, as ações da Nvidia (Nasdaq: NVDA) subiram quase 5% durante o discurso, depois recuaram, fechando o dia com alta de 1,63%, a 183,19 dólares por ação, com valor de mercado de 4,45 trilhões de dólares.

(Origem: 澎湃新闻)

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar