2026 đang hội tụ vào 3 cược lớn thực sự nếu một trong số đó thất bại sẽ dẫn đến sự sụp đổ ngắn hạn của bong bóng
1. trung tâm dữ liệu
anthropic, Xai mở rộng mạnh mẽ lên 1 triệu GPU. cả hai dự định đạt mục tiêu đó vào Quý 2. các mô hình được huấn luyện trên hạ tầng này cần xác nhận quy luật mở rộng tính toán vẫn còn hiệu quả. nếu không sẽ cho thấy chúng ta cần khám phá kiến trúc mô hình mới. điều này còn phụ thuộc vào hạ tầng năng lượng (power shell) được mở rộng mặc dù điều đó sẽ là vấn đề trong thập kỷ tới chứ chưa nói đến năm nay.
2. bộ nhớ
chúng ta chỉ có đủ bộ nhớ trong năm nay để hỗ trợ 15GW GPU trong khi các nhà hyperscaler nhắm tới 30-40GW trong 2 năm tới. chúng ta đang khá sát nút - nếu Samsung, $MU hoặc sk hynix làm hỏng sản xuất của họ thì điều này sẽ làm chậm cược số 1. cũng như ai chiếm phần lớn dung lượng bộ nhớ này để tạo ra GPU sẽ thắng nhiều nhất trong khả năng sản xuất hạn chế và hiện tại đó là $NVDA
3. hạ tầng rẻ hơn, hiệu quả hơn
GPU mới nhất của Nvidia Vera Rubin hiệu suất gấp 5 lần nhưng quan trọng hơn là hiệu quả tính toán gấp 4 lần nghĩa là chi phí suy luận đã giảm mạnh - trí tuệ frontier chỉ với vài xu! sẽ có nhiều khả năng tính toán để huấn luyện nhưng quan trọng hơn là sử dụng AI trong năm nay, vì vậy nghịch lý Jevons cần chứng minh qua nhu cầu tăng lên. nếu thất bại thì hai yếu tố trên sẽ sụp đổ. theo tôi, tôi ít lo lắng về điều này - tôi nghĩ agent harnesses và RL hậu huấn luyện sẽ tiếp tục củng cố các mô hình.
rất lạc quan
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
2026 đang hội tụ vào 3 cược lớn thực sự nếu một trong số đó thất bại sẽ dẫn đến sự sụp đổ ngắn hạn của bong bóng
1. trung tâm dữ liệu
anthropic, Xai mở rộng mạnh mẽ lên 1 triệu GPU. cả hai dự định đạt mục tiêu đó vào Quý 2. các mô hình được huấn luyện trên hạ tầng này cần xác nhận quy luật mở rộng tính toán vẫn còn hiệu quả. nếu không sẽ cho thấy chúng ta cần khám phá kiến trúc mô hình mới. điều này còn phụ thuộc vào hạ tầng năng lượng (power shell) được mở rộng mặc dù điều đó sẽ là vấn đề trong thập kỷ tới chứ chưa nói đến năm nay.
2. bộ nhớ
chúng ta chỉ có đủ bộ nhớ trong năm nay để hỗ trợ 15GW GPU trong khi các nhà hyperscaler nhắm tới 30-40GW trong 2 năm tới. chúng ta đang khá sát nút - nếu Samsung, $MU hoặc sk hynix làm hỏng sản xuất của họ thì điều này sẽ làm chậm cược số 1. cũng như ai chiếm phần lớn dung lượng bộ nhớ này để tạo ra GPU sẽ thắng nhiều nhất trong khả năng sản xuất hạn chế và hiện tại đó là $NVDA
3. hạ tầng rẻ hơn, hiệu quả hơn
GPU mới nhất của Nvidia Vera Rubin hiệu suất gấp 5 lần nhưng quan trọng hơn là hiệu quả tính toán gấp 4 lần nghĩa là chi phí suy luận đã giảm mạnh - trí tuệ frontier chỉ với vài xu! sẽ có nhiều khả năng tính toán để huấn luyện nhưng quan trọng hơn là sử dụng AI trong năm nay, vì vậy nghịch lý Jevons cần chứng minh qua nhu cầu tăng lên. nếu thất bại thì hai yếu tố trên sẽ sụp đổ. theo tôi, tôi ít lo lắng về điều này - tôi nghĩ agent harnesses và RL hậu huấn luyện sẽ tiếp tục củng cố các mô hình.
rất lạc quan