Nvidia GTC: Весняний фестиваль у світі штучного інтелекту — чи виправдалися очікування, чи залишилися розчарованими?

Question

16 березня 2026 року засновник і генеральний директор NVIDIA Дженсен Хуанг виступив із ключовою промовою на конференції GTC 2026, у якій обговорювалися 20-річчя платформи CUDA, переломні моменти в інференсі та зростання обчислювальної потужності, архітектура систем Vera Rubin, інтеграція Groq, революція агентів OpenClaw, фізичний AI та роботи.
Огляд основних моментів GTC2026
1) Перспективи доходів дата-центрів: Очікується, що сукупний дохід дата-центрів у 2025-2027 роках досягне 1 трильйона доларів (минулого року на GTC вказували 500 мільярдів доларів за 2025-2026 роки), що відповідає очікуванням. Основний ринок вже підвищив свої прогнози понад 1 трильйон доларів, а ще більше очікувань викликає чітке визначення замовлень та інших деталей від компанії.
2) Продуктивність і вартість: за показниками tokens/watt (пропускна здатність) і швидкості токенів (інтелектуальність) NVIDIA є світовим лідером; вартість токена у NVIDIA найнижча у світі.
3) Дата-центри стають “фабриками токенів”: кожен завод обмежений потужністю (наприклад, 1 ГВт), потрібно керувати пропускною здатністю та швидкістю виробництва токенів.
Токени будуть поділені на рівні, як сировина: безкоштовний рівень (висока пропускна здатність, низька швидкість) -> рівень за $3/мільйон токенів -> рівень за $6/мільйон токенів -> рівень за $45/мільйон токенів -> рівень за $150/мільйон токенів (найвищий з низькою затримкою і високою пропускною здатністю).
На прикладі дата-центру потужністю 1 ГВт кожні 25% потужності відповідає одному рівню: Grace Blackwell може приносити у 5 разів більше доходу, ніж Hopper, а Vera Rubin — у 5 разів більше.
4) Vera Rubin: на основі шести попередніх типів чипів додано Groq 3 LPU.
① Vera Rubin: 100% рідинне охолодження (гаряча вода 45°C), всі кабелі скасовані, час встановлення скоротився з двох днів до двох годин;
② CPO (спільне пакування оптики) Spectrum-X комутатор: вже масове виробництво, спільна розробка з TSMC;
③ CPU: єдиний у світі дата-центр CPU з LPDDR5, продається окремо, стане мільярдним бізнесом;
Vera CPU Tray для агентних навантажень, один Tray містить 8 процесорів Vera, кожен з 88 ядрами, підтримує 8 каналів LPDDR5x, пропускна здатність пам’яті до 1.2 ТБ/с. На Tray інтегровані 2 DPU BF4.
④ Vera Rubin: вже запущений у Microsoft Azure (перший rack). NVIDIA може щотижня виробляти тисячі систем, а місячна потужність AI-заводів — кілька ГВт;
⑤ Rubin Ultra: Rubin — горизонтальний модуль у шафі, Rubin Ultra — вертикальний у новому шасі Kyber, де 144 GPU у одному NVLink-домені, а між платами використовується NVLink-комутатор замість кабелів.
5) Groq 3 LPU (новий чип): поєднання Groq і HBM, відповідає очікуванням.
Технологія походить від купленої команди Groq, LP30 виробляє Samsung, очікується поставка у третьому кварталі.
Один Groq з 500MB SRAM проти одного Rubin з 288GB, Groq не може самостійно обробляти великі моделі та KV Cache.
Рішення: запущено програмне забезпечення Dynamo, яке розбиває процес інференсу на етапи:
1. Попереднє заповнення (Prefill): основний етап обробки запитів користувачів, виконується на Vera Rubin;
2. Механізм уваги при декодуванні: обчислює зв’язок між поточним токеном і історичними (KV Cache), виконується на Vera Rubin з частим доступом до HBM;
3. Передача через FNN: після визначення контексту уваги, FNN генерує ймовірність наступного токена та обирає його, тобто “вивід слова”.
Кожен рівень цієї обробки потребує зчитування вагових параметрів моделі, що виконується по одному токену за раз. Ваги зберігаються в HBM, обчислювальні блоки очікують передачі даних — це “стіна пам’яті”.
Розділивши декодування на два етапи за допомогою софту, модель зберігає “контекстну пам’ять” у HBM, а більша частина ваг — у SRAM Groq, що дозволяє швидко зчитувати їх і вирішити проблему повільного інференсу.
Між Rubin і Groq використовується швидкий Ethernet, RDMA-з’єднання зменшує затримки приблизно удвічі.
6) Feynman: новий GPU + LP40 (LPU) + Rosa CPU (названий на честь Rosalind) + BlueField-5 + CX10.
Масштабування Kyber через кабелі та CPO (спільне пакування) — вперше підтримують і кабелі, і CPO одночасно, тобто навіть на етапі Feynman підтримується гібридна схема.
Хоча NVIDIA довго підтримує CPO, клієнти схильні спочатку максимально використовувати кабелі, а потім переходити на CPO через простоту обслуговування.
7) Інша інформація:
① Космічний дата-центр: для вирішення проблеми енергопостачання NVIDIA анонсувала Vera Rubin Space-1 — розгортання дата-центрів у космосі (потрібно вирішити питання радіації та тепловідведення, у космосі немає конвекції та провідності, лише випромінювання);
② OpenClaw: SaaS-компанії перетворюються на GaaS (Agent-as-a-Service).
Агентські системи у корпоративних мережах можуть отримувати доступ до конфіденційної інформації, виконувати код і спілкуватися зовні — потрібен високий рівень безпеки. NVIDIA співпрацює з засновником OpenClaw Peter Steinberger для створення NemoClaw (безпечний корпоративний дизайн OpenClaw), з інтеграцією технології OpenShell, що включає мережеві бар’єри та приватні маршрутизатори, які можуть підключатися до стратегій SaaS-компаній;
③ Фізичний AI і роботи: у сфері автономного водіння — BYD, Geely, Hyundai, Nissan та інші компанії приєдналися до Robtaxi у співпраці з Uber. У робототехніці — KUKA, ABB та інші виробники, а також багато платформ роботів і безпілотників.

Загалом, ця презентація, крім уточнення гібридного використання кабелів і CPO, додала новий серверний варіант із Groq LPU. Після купівлі Groq ринок вже мав високі очікування; навіть орієнтири на три роки з доходом у 1 трильйон доларів вже фактично перевищені.
Загалом, з продуктового оновлення NVIDIA видно, що останні роки фокус змістився з інновацій у мікроархітектурі чипів (від Hopper до Blackwell — переважно питання комбінацій і з’єднань), NVIDIA перейшла від продажу чипів до продажу систем і сервісів.
Від Blackwell до Rubin — нові компоненти, такі як DPU (NAND-чип) і LPU (SRAM), — головне завдання — подолання “стінки пам’яті” у AI, інференсі та агентних системах.
Друге — сучасний стан NVIDIA: конференція зменшена, потрібні “нові історії зростання”
За останні півроку акції NVIDIA коливалися в межах 170–200 доларів. Навіть при зростанні капіталовкладень великих компаній і стабільних перевищеннях очікувань у фінансових показниках, ціна не зростала через побоювання ринку:

a) Постійність капіталовкладень великих гравців: Meta, Google та інші компанії заявили про збільшення капітальних витрат у 2026 році, очікується понад 660 мільярдів доларів, зростання на 60%. Але частка цих витрат у доходах вже досить велика.
Наприклад, Meta прогнозує витрати у 1150–1350 мільярдів доларів, що перевищує половину річного доходу, і потенціал для подальшого зростання обмежений. Навіть із зростанням інвестицій, ринок залишається скептичним щодо подальшого зростання капіталовкладень.
b) Частка ринку AI-чипів: NVIDIA утримує понад 75% ринку AI-чипів, що за високою ціною і монопольною структурою викликає пошук альтернатив.
Крім Google, Broadcom (AVGO) отримала великі замовлення від Anthropic, OpenAI та інших, і багато клієнтів почали самостійно розробляти рішення. Навіть із новими Rubin, ринок очікує зниження частки NVIDIA.
3) Конкурентоспроможність продуктів: Тепер TPUv7 від Google у FP8 і подібних сферах вже близький до NVIDIA B200 (масове виробництво у Q4 2024), відставання приблизно на рік.
NVIDIA у Blackwell додала формат NVFP4, що подвоює продуктивність у FP8. Але FP8 вже задовольняє більшість потреб ринку, TPUv7 — це вже альтернативний варіант.
Щоб протистояти конкуренції, NVIDIA інвестує стратегічно і розширює обчислювальні потужності, наприклад, інвестуючи у OpenAI (300 мільярдів доларів) і Anthropic (100 мільярдів), а також підтримуючи нові лабораторії Meta MSL, надаючи мільйони GPU, що частково знижує ціну і закріплює клієнтів.
З урахуванням цих побоювань, оцінка компанії залишається відносно низькою. За даними на 2025–2027 роки, доходи дата-центрів — понад 1.15 трильйона доларів (більше за поточні орієнтири).

Загалом, ринкова капіталізація NVIDIA — 4.4 трильйона доларів, а чистий прибуток за 2028 фінансовий рік (приблизно 2027) — приблизно 13-кратний P/E (при прогнозі зростання доходів 64% за два роки і маржі 72%, податковій ставці 18%).
Незважаючи на перевищення очікувань у попередньому кварталі, ціна акцій не зросла, оскільки ринок вже заклав у ціну очікування на 2027 рік, і побоюється, що при високих капіталовкладеннях клієнтів зростання доходів зупиниться.
Теоретично, при високих витратах клієнтів NVIDIA може отримувати нульовий приріст доходів від хмарних клієнтів, і ринок не готовий переоцінювати компанію після 2027 року, тому P/E зменшується до 13X.
З урахуванням виступу на GTC, де CEO заявив про досягнення понад 1 трильйона доларів у доходах дата-центрів до 2027 року, ринок вже заклав у ціну ще вищі показники.
Більша частина презентації була присвячена просуванню продуктів і стратегії компанії, а вплив на ланцюжки поставок — через гібридне використання CPO і кабелів, а також LPU і HBM — залишився другорядним.

Майбутнє підвищення P/E NVIDIA залежить не лише від масштабного впровадження AI, а й від появи нових “стратегій зростання”, таких як “Physic AI”, “космічні обчислення” тощо.

Nvidia GTC: Весняний фестиваль у світі штучного інтелекту — чи виправдалися очікування, чи залишилися розчарованими?

Популярні теми

GateAIGateClawOfficiallyLaunches

BitcoinBoomsAbove$75K

IsraelStrikesIranBTCPlunges

NvidiaGTC2026ConferenceBegins

IranDeploysMinesInStraitOfHormuz

Популярні активності Gate Fun

BBL

BlackBullion

AG

AG

什么是爱

什么是爱

SAUDADE

SAUDADE

bur

buratino

Закріпити