Escassez de poder de processamento de GPU se repete: grandes empresas como OpenAI, Anthropic e outras absorvem a oferta, novas startups de IA aguardam até o final do ano

Microsoft, Amazon e outros grandes fornecedores de nuvem estão concentrando a capacidade de GPU da NVIDIA para as suas equipas internas e clientes de topo como OpenAI, Anthropic, entre outros, enquanto as startups de IA de pequeno e médio porte enfrentam uma tripla pressão: aumento de 32% nos alugueres, filas até ao final do ano e limites contratuais que atingem dezenas de milhões de dólares. Algumas venture capital já começaram a planear pools de capacidade partilhada para negociação coletiva, enquanto novas startups optam por comprar GPUs por conta própria para evitar filas.
(Antecedentes: o preço das ações da NVIDIA atingiu um máximo histórico, com uma capitalização de mercado superior a 5 biliões de dólares: um investimento de 5 mil milhões na Intel em menos de um ano duplicou, com lucros de 12,7 mil milhões)
(Complemento de contexto: Transcrição completa do discurso de Jensen Huang na GTC2026: a procura por IA atingiu trilhões de dólares, a capacidade de processamento cresceu 350 vezes, e o OpenClaw transforma cada empresa numa AaaS)

Índice deste artigo

Alternar

  • Há meio ano, 2,80 dólares, renovação passou a 3,70 dólares
  • O sistema de níveis da Microsoft
  • As venture capital já começaram a procurar soluções

40 mil GPUs estão online, enquanto há uma procura de 400 mil unidades em fila de espera. Segundo a reportagem do The Information, o fornecedor de nuvem de GPU Lightning AI, CEO Will Falcon, forneceu um número que descreve com precisão a relação oferta/demanda do mercado de capacidade de IA em 2026, que é de 1 para 10. Na sua plataforma, há cerca de 40 clientes à espera, e os preços de aluguer aumentaram mais de 25% nos últimos seis meses.

Há meio ano, 2,80 dólares, renovação passou a 3,70 dólares

A startup de geração de imagens Krea (com um financiamento total de 83 milhões de dólares, incluindo investidores como Andreessen Horowitz e Bain Capital Ventures) alugou, há meio ano, várias GPUs NVIDIA Blackwell a 2,80 dólares por hora por cartão, com um contrato de 6 meses. Quando tentou renovar, várias empresas de nuvem simplesmente não atenderam as chamadas.

No final, o preço foi fechado a 3,70 dólares, um aumento de 32%, e o contrato foi prolongado para 1 ano. O CEO da Krea, Victor Perez, afirmou que algumas empresas só estão dispostas a negociar contratos de três anos, enquanto outras simplesmente não respondem.

Este não é um caso isolado: o Índice de Preços de Computação Ornn mostra que o aluguer por hora do Blackwell disparou para 4,08 dólares, um aumento de 48% em dois meses.

O preço de aluguer de um ano do H100 também subiu de 1,70 dólares em outubro de 2025 para 2,35 dólares em março de 2026, um aumento de quase 40%.

O sistema de níveis da Microsoft

A Microsoft implementa uma gestão por níveis no acesso às GPUs, priorizando cerca de 1.000 dos seus maiores clientes (Nível 1) na distribuição de capacidade; clientes menores que queiram alugar Blackwell precisam comprometer-se a adquirir pelo menos 1.000 unidades, por um período mínimo de um ano, com contratos que começam em dezenas de milhões de dólares.

Clientes que pagam por uso (pay-as-you-go) podem ter o acesso revogado se deixarem as GPUs ociosas por algumas horas. Startups que participam do plano gratuito “Microsoft for Startups” também são informadas de que, se não utilizarem as GPUs de forma suficiente, o acesso será retirado. A equipa de vendas do Azure informou recentemente aos funcionários que o tempo de espera por GPUs na nuvem deverá manter-se até ao final de 2026.

Atualmente, a Microsoft concentra a capacidade de processamento para grandes clientes como OpenAI e Anthropic, enquanto as startups de IA de pequeno e médio porte ficam na fila de espera.

As venture capital já começaram a procurar soluções

O sócio da General Catalyst, Hemant Taneja, enviou questionários às empresas investidas para investigar as dificuldades de capacidade, enquanto a organização planeja pools de capacidade partilhada ou empresas de investimento coletivo para negociação em grupo.

Um caso mais extremo é a startup de IA na indústria petrolífera, Collide, que planeja gastar cerca de 500 mil dólares para comprar GPUs NVIDIA diretamente, alugando espaço em data centers para operar por conta própria, a fim de evitar filas e a incerteza de preços. Quando uma startup petrolífera decide voltar à compra de hardware e aluguer de servidores, todos percebem que a cadeira na nuvem já está demasiado cheia.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar