2026 год консолидируется в три действительно больших ставки, при провале одной из которых может произойти краткосрочный крах пузыря
1. дата-центры
anthropic, Xai масштабируются агрессивно до 1М GPU. оба планируют достичь этой цели к Q2. обученные на этой инфраструктуре модели должны подтвердить, что закон масштабирования вычислений все еще эффективен. иначе это укажет на необходимость изучения новой архитектуры модели. это также зависит от масштабирования энергетической инфраструктуры (power shell), что будет проблемой на следующий десяток лет, не говоря уже о этом году.
2. память
в этом году у нас есть только достаточно памяти для поддержки 15ГВт GPU, в то время как гипермасштаберы нацелены на 30-40ГВт за следующие 2 года. мы немного на грани — если Samsung, $MU или SK Hynix провалят производство, это остановит ставку номер 1. также тот, кто обеспечит большинство этого объема памяти для создания GPU, выиграет больше всего в рамках ограниченной производственной мощности, а сейчас это $NVDA
3. более дешевое, более эффективное инфраструктурное решение
последний GPU Nvidia Vera Rubin в 5 раз производительнее, но что важно, в 4 раза более энергоэффективен, что означает, что затраты на выводы снизились — передовая интеллектуальность за копейки! будет изобилие вычислений для обучения, а еще важнее — для использования ИИ в этом году, поэтому парадокс Джевонса должен доказать себя через растущий спрос. если это не произойдет, то указанные выше два пункта рухнут. по моему мнению, я меньше всего обеспокоен этим — я считаю, что агенты-хранители и постобучение RL продолжат укреплять модели.
очень бычий настрой
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
2026 год консолидируется в три действительно больших ставки, при провале одной из которых может произойти краткосрочный крах пузыря
1. дата-центры
anthropic, Xai масштабируются агрессивно до 1М GPU. оба планируют достичь этой цели к Q2. обученные на этой инфраструктуре модели должны подтвердить, что закон масштабирования вычислений все еще эффективен. иначе это укажет на необходимость изучения новой архитектуры модели. это также зависит от масштабирования энергетической инфраструктуры (power shell), что будет проблемой на следующий десяток лет, не говоря уже о этом году.
2. память
в этом году у нас есть только достаточно памяти для поддержки 15ГВт GPU, в то время как гипермасштаберы нацелены на 30-40ГВт за следующие 2 года. мы немного на грани — если Samsung, $MU или SK Hynix провалят производство, это остановит ставку номер 1. также тот, кто обеспечит большинство этого объема памяти для создания GPU, выиграет больше всего в рамках ограниченной производственной мощности, а сейчас это $NVDA
3. более дешевое, более эффективное инфраструктурное решение
последний GPU Nvidia Vera Rubin в 5 раз производительнее, но что важно, в 4 раза более энергоэффективен, что означает, что затраты на выводы снизились — передовая интеллектуальность за копейки! будет изобилие вычислений для обучения, а еще важнее — для использования ИИ в этом году, поэтому парадокс Джевонса должен доказать себя через растущий спрос. если это не произойдет, то указанные выше два пункта рухнут. по моему мнению, я меньше всего обеспокоен этим — я считаю, что агенты-хранители и постобучение RL продолжат укреплять модели.
очень бычий настрой