La pénurie de puissance GPU se répète : OpenAI, Anthropic et autres grands acteurs absorbent l'offre, les nouvelles startups en IA attendent jusqu'à la fin de l'année

Microsoft, Amazon et d’autres grands fournisseurs de cloud concentrent la puissance de calcul des GPU NVIDIA au sein de leurs équipes internes ainsi que pour des clients de premier plan tels qu’OpenAI et Anthropic, ce qui met les petites et moyennes startups en IA face à une triple pression : augmentation de 32 % des loyers, files d’attente jusqu’à la fin de l’année, et seuils contractuels atteignant plusieurs dizaines de millions de dollars. Certains fonds de capital-risque ont déjà commencé à planifier des pools de puissance de calcul partagés pour négocier collectivement, tandis que de nouvelles startups dépensent directement pour acheter des GPU afin d’éviter les files d’attente.
(Précédent contexte : Nvidia a atteint un nouveau sommet historique en valorisation boursière dépassant 5 000 milliards de dollars : 5 milliards investis dans Intel en moins d’un an ont été multipliés par 2,5, avec un bénéfice comptable de 12,7 milliards de dollars)
(Complément d’information : Discours intégral de Jensen Huang à GTC2026 : la demande en IA atteindra plusieurs milliers de milliards de dollars, la puissance de calcul a été multipliée par 350, OpenClaw permettant à chaque entreprise de devenir une AaaS)

Table des matières de cet article

Toggle

  • Il y a six mois, 2,80 $, renouvellement à 3,70 $
  • Le système de classification de Microsoft
  • Les fonds de capital-risque ont déjà commencé à trouver leurs propres solutions

40 000 GPU en ligne, 400 000 en attente. Selon The Information, le PDG de Lightning AI, fournisseur de cloud GPU, Will Falcon, a fourni une série de chiffres décrivant un rapport offre/demande de 1 pour 10 sur le marché de la puissance de calcul IA en 2026. Environ 40 clients attendent sur sa plateforme, et le prix de location a augmenté de plus de 25 % au cours des six derniers mois.

Il y a six mois, 2,80 $, renouvellement à 3,70 $

La startup de génération d’images Krea (avec un financement total de 83 millions de dollars, incluant Andreessen Horowitz et Bain Capital Ventures) a loué, il y a six mois, plusieurs centaines de GPU NVIDIA Blackwell à 2,80 dollars par heure par carte, pour un contrat de 6 mois. Lors du renouvellement, plusieurs fournisseurs de cloud ont simplement ignoré les appels.

Finalement, la transaction a été conclue à 3,70 dollars, soit une hausse de 32 %, avec une prolongation du contrat à un an. Victor Perez, PDG de Krea, indique que certains fournisseurs proposent des contrats de trois ans pour négocier, d’autres ne répondent tout simplement pas.

Ce n’est pas un cas isolé : l’indice Ornn Compute Price montre que le loyer horaire de Blackwell a déjà atteint 4,08 dollars, en hausse de 48 % en deux mois.

Le prix d’un contrat annuel pour H100 est également passé de 1,70 dollar en octobre 2025 à 2,35 dollars en mars 2026, soit une augmentation de près de 40 %.

Le système de classification de Microsoft

Microsoft applique une gestion par niveaux pour l’accès aux GPU, privilégiant environ 1 000 de ses plus grands clients (Tier 1) en leur attribuant en priorité la puissance de calcul ; pour les petits clients souhaitant louer Blackwell, ils doivent s’engager pour au moins 1 000 GPU, pour une durée minimale d’un an, avec un contrat débutant à plusieurs dizaines de millions de dollars.

Les clients payant à l’usage (pay-as-you-go) peuvent voir leur accès révoqué si le GPU reste inutilisé pendant quelques heures. Les startups participant au programme gratuit « Microsoft for Startups » ont également été informées que leur accès pourrait être retiré en cas de sous-utilisation. La direction des ventes Azure a récemment indiqué aux employés que le temps d’attente pour les GPU dans le cloud devrait durer jusqu’à la fin 2026.

Actuellement, Microsoft concentre l’offre de puissance de calcul pour ses grands clients comme OpenAI et Anthropic, laissant les startups IA de petite et moyenne taille faire la queue.

Les fonds de capital-risque ont déjà commencé à trouver leurs propres solutions

Hemant Taneja, associé chez General Catalyst, a interrogé les entreprises financées pour sonder leurs difficultés en matière de puissance de calcul, et cette organisation planifie la création de pools de puissance partagée ou la négociation collective via des sociétés de gestion de fonds.

Un cas encore plus extrême concerne la startup IA du secteur pétrolier, Collide, qui prévoit d’investir environ 500 000 dollars pour acheter directement des GPU NVIDIA, louer des centres de données pour faire tourner ses modèles, afin d’éviter les files d’attente et l’incertitude des prix. Lorsqu’une startup pétrolière décide de revenir à l’achat de matériel et à la location de serveurs, tout le monde sait que la place dans le cloud devient trop encombrée.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler