Công suất tính toán đang tập trung lại: Sau khi DeepSeek giảm giá, ai sẽ kiểm soát hạ tầng AI?

Question

null——Bắt đầu từ bài phát biểu của Gonka tại LA Hacks 2026Ngày 26 tháng 4, DeepSeek công bố giá API dòng V4 mới: toàn bộ hệ thống giảm giá bộ nhớ đệm truy cập trúng giá xuống còn một phần mười so với giá phát hành ban đầu, sau ưu đãi giới hạn thời gian của phiên bản Pro, chi phí xử lý một triệu Token thấp tới 0,025 nhân dân tệ—rẻ hơn gần một trăm lần so với một năm trước. Ngày hôm đó, các cổ phiếu trong lĩnh vực tính toán của cổ phiếu A đồng loạt tăng trần, tâm lý thị trường sôi động.Nhưng đằng sau tiếng reo hò, có một vấn đề chưa ai thảo luận trực diện: khi mô hình ngày càng rẻ hơn, sức mạnh tính toán cần để vận hành mô hình đang tập trung ngày càng nhiều.Dữ liệu không nói dối. Quý IV năm 2025, tổng chi tiêu vốn của bốn nhà cung cấp đám mây Microsoft, Amazon, Meta, Google tăng 64% so với cùng kỳ, đạt 1186 tỷ USD; dự kiến tổng chi tiêu vốn trong năm 2026 sẽ tiếp tục tăng 53% so với cùng kỳ, đạt 5708 tỷ USD. Cùng kỳ, Google nâng mục tiêu xuất xưởng chip TPU năm 2026 thêm 50% lên 6 triệu chiếc. Thời gian giao hàng của dòng H100 của Nvidia đã kéo dài tới vài tháng ở một số thị trường.Quyền định giá ở tầng mô hình đang nghiêng về phía nhà phát triển, nhưng quyền kiểm soát sức mạnh tính toán đang nhanh chóng tập trung vào một số ít ông lớn. Đây là một mâu thuẫn ẩn nhưng sâu sắc trong thời đại AI.Trong bối cảnh đó, ngày 24 tháng 4 năm 2026, đồng sáng lập Gonka Protocol, Daniil và David Liberman, đã bước lên bục phát biểu chính tại LA Hacks 2026. Đây là cuộc thi hack lớn nhất của UCLA trong năm, năm nay có Liberman anh em làm khách mời chính, đối diện hàng trăm kỹ sư hàng đầu sắp bước vào ngành này. Câu hỏi họ đặt ra, lúc này đặc biệt rõ ràng: tính toán phi tập trung, liệu còn kịp không?一、Phía ngược của làn sóng giảm giáLogic giảm giá của DeepSeek V4, về bề mặt, là lợi ích hiệu quả do tiến bộ công nghệ mang lại—cơ chế chú ý mới nén chiều Token, kết hợp chú ý thưa DSA, giảm đáng kể yêu cầu về tính toán và bộ nhớ đồ họa. Nhưng việc giảm giá có thể tiếp tục, dựa trên giả thiết rằng sức mạnh tính toán ở đâu đó đủ lớn, đủ rẻ.Thực tế, nguồn sức mạnh tính toán "đủ lớn" này đang nhanh chóng hội tụ về một số ít nút trên toàn cầu. Giám đốc điều hành của Lumentum, công ty hàng đầu về truyền thông quang, Michael Hurlston, gần đây nói rằng, theo xu hướng hiện tại, công ty gần như đã bán hết công suất đến năm 2028. Đây không chỉ là khó khăn của một số công ty, mà là sự căng thẳng chung của chuỗi cung ứng hạ tầng AI trong bối cảnh nhu cầu mở rộng nhanh chóng.Daniil trong bài phát biểu tại LA Hacks đã dùng một so sánh đơn giản nhưng mạnh mẽ: sức mạnh tính toán của mạng Bitcoin đã vượt quá tổng cộng của ba trung tâm dữ liệu đám mây Google, Microsoft, Amazon—nhưng chúng đang làm gì? Giải một câu đố băm không cần ai trả lời. Sức mạnh GPU rảnh rỗi toàn cầu cũng vậy: card đồ họa trong máy game, máy chủ trong phòng máy của đại học, dư thừa của các nhà cung cấp dịch vụ đám mây nhỏ và trung bình, cộng lại rất lớn, nhưng do thiếu cơ chế phối hợp, không thể dùng cho suy luận AI.Gonka cố gắng giải quyết chính xác vấn đề phối hợp này—bằng cơ chế khuyến khích dựa trên chứng minh công việc, tổ chức GPU rảnh rỗi toàn cầu thành một mạng lưới có thể nhận các nhiệm vụ suy luận AI thực sự.二、Suy luận là chiến trường mớiViệc giảm giá của DeepSeek đã gây ra cuộc thảo luận rộng rãi về "bình đẳng AI" trong cộng đồng internet Trung Quốc. Nhưng có một chi tiết bị bỏ qua: giảm giá là "giá gọi dịch vụ", chứ không phải "chi phí sức mạnh tính toán". Khi quy mô ứng dụng AI mở rộng, sự tăng trưởng của lượng gọi suy luận là theo cấp số nhân—theo dự báo ngành, đến năm 2026, suy luận sẽ chiếm khoảng hai phần ba tổng tiêu thụ sức mạnh AI toàn cầu.Điều này có nghĩa là gì? Mỗi lần giảm một cấp độ về giá gọi, tổng lượng sức mạnh tính toán cần thiết thực tế sẽ nhiều hơn, chứ không ít đi. Việc "dân chủ hóa" các mô hình lớn, về mặt nào đó, lại thúc đẩy sự tập trung của tầng tính toán—bởi chỉ những người có quy mô sức mạnh tính toán lớn mới có thể duy trì vận hành dịch vụ suy luận với lợi nhuận cực thấp.Đây là một cấu trúc khóa chặt đang hình thành: ai kiểm soát sức mạnh vật lý của phía suy luận, người đó kiểm soát cổng vào hạ tầng thực sự của thời đại AI. Từ góc độ này, mạng lưới tính toán phi tập trung không chỉ là tối ưu hóa chi phí "giảm 50%", mà còn là một con đường thay thế mang tính cấu trúc trước khi quá trình tập trung hoàn tất.三、Thách thức thực sự dành cho các nhà xây dựng trẻTham gia LA Hacks—đến từ các trường đại học hàng đầu California—các kỹ sư và nhà sản phẩm sẽ sớm đối mặt với một lựa chọn kỹ thuật không mấy lãng mạn: xây dựng sản phẩm của mình dựa trên tầng sức mạnh tính toán nào.Sản phẩm AI của bạn, ai là người chạy suy luận?Khi nền tảng đó điều chỉnh chiến lược giá hoặc chính sách truy cập, bạn có khả năng di chuyển không?Quy mô người dùng bạn giúp xây dựng, là tạo giá trị cho chính mình hay cung cấp "đặc quyền" cho nền tảng?Những câu hỏi này đã từng trải qua trong thời đại Web2: khi vận mệnh ứng dụng gắn chặt với thuật toán hoặc quy tắc phân phối của nền tảng, "độc lập" trở thành một khái niệm cần định nghĩa lại bất cứ lúc nào. Trong thời đại AI, phụ thuộc vào sức mạnh tính toán sẽ lặp lại logic đó—và do chi phí chuyển đổi cao hơn, hiệu ứng khóa chặt sẽ càng mạnh hơn.Hackathon, dưới dạng một hình thức, mang tính mỉa mai nội tại: trong 36 giờ, dùng ít tài nguyên nhất, xây dựng được thứ có thể vận hành—đây chính là trạng thái mà cơ chế khuyến khích mạng phi tập trung hướng tới. Daniil đứng trên sân khấu LA Hacks không chỉ để nói về Gonka, mà còn như đang hỏi nhóm người này: tương lai các bạn sẽ làm gì? Giúp quá trình tập trung hóa này tăng tốc, hay tạo ra những khả năng mới?四、PoW 2.0: Một đề bài kỹ thuậtGonka điều chỉnh lại cơ chế khuyến khích dựa trên chứng minh công việc từ việc tính băm sang phù hợp với suy luận AI, khiến gần 100% sức mạnh tính toán trong mạng đóng góp trực tiếp cho các nhiệm vụ thực tế. Cơ chế này có một yêu cầu kỹ thuật then chốt: nhiệm vụ suy luận AI phải có thể xác minh, có thể tái tạo—với cùng trọng số mô hình, cùng seed ngẫu nhiên và đầu vào, bất kỳ nút nào cũng có thể tái tạo kết quả tính toán và xác thực tính hợp lệ của nó. Đây là khó khăn cốt lõi để Gonka từ nguyên mẫu học thuật chuyển sang mạng vận hành thực tế.Về mặt kinh tế, ý nghĩa của cơ chế này là: giá trị token tự nhiên gắn liền với chi phí sức mạnh vật lý, chứ không phải tâm lý thanh khoản. Các thợ mỏ đóng góp sức mạnh tính toán nhận phần thưởng, nhà phát triển trả phí cho việc gọi sức mạnh—toàn bộ vòng khuyến khích không dựa vào thiện chí của trung gian nào.Tất nhiên, khả năng kỹ thuật chỉ là một phần. Vấn đề khó hơn là: trong bối cảnh nhu cầu sức mạnh tính toán tăng nhanh, các ông lớn chi hàng tỷ USD, liệu một mạng lưới phân tán dựa trên cộng đồng tự tổ chức có thể cạnh tranh quy mô thực sự?Dữ liệu ban đầu của Gonka đưa ra một tham chiếu: chưa đầy một năm sau khi ra mắt mainnet, tổng sức mạnh mạng đã mở rộng từ 60 H100 lên hơn 10.000 H100—tốc độ này đến từ hàng trăm nút độc lập tự phát tham gia, chứ không phải phân phối trung tâm. Điều này chưa chứng minh vấn đề quy mô đã được giải quyết, nhưng cho thấy cơ chế khuyến khích đã thúc đẩy tăng trưởng ban đầu hiệu quả.五、Vấn đề của thời điểm cửa sổTrong lịch sử, quyền kiểm soát hạ tầng thường hội tụ rất nhanh trong giai đoạn đầu—điều này đúng với thời kỳ đường sắt, internet, và internet di động. Mỗi lần như vậy, có người tìm cách chen chân trước khi tiêu chuẩn chưa cố định, và có người nhận ra quyền tham gia đã bị thu hẹp đáng kể sau khi tập trung hóa hoàn tất.Hiện tại, hạ tầng tính toán AI đang ở giai đoạn nào? Nhìn vào dự kiến chi tiêu vốn 5708 tỷ USD của bốn nhà cung cấp đám mây năm 2026, sự tập trung đang gia tăng; nhưng theo cách sử dụng thực tế của nhà phát triển, vẫn còn nhiều nguồn lực chưa được tích hợp hiệu quả. Khoảng trống này chính là không gian tồn tại của mạng lưới phi tập trung về mặt cấu trúc.Daniil trong bài phát biểu đã trích dẫn một so sánh: sau khi bong bóng internet vỡ năm 2000, không phải là đống đổ nát, mà là mạng cáp quang phủ khắp toàn cầu, hỗ trợ nền kinh tế số suốt hai mươi năm sau đó. Sau khi cơn sốt đầu tư hạ tầng AI nguội đi, các giao thức và cơ chế khuyến khích dựa trên sức mạnh tính toán sẽ trở thành hạ tầng của chu kỳ tiếp theo—vấn đề là, các giao thức đó có đủ vững chắc để duy trì hoạt động dưới áp lực?Đây không chỉ là câu hỏi về một dự án cụ thể, mà là vấn đề toàn diện mà ngành AI phi tập trung cần đối mặt: liệu thiết kế quản trị có thể thực sự chống lại sự xói mòn của kiểm soát đơn điểm? Cơ chế khuyến khích có còn hiệu quả khi quy mô mở rộng? Sự phi tập trung của mạng lưới sức mạnh tính toán, có thể thành lập đồng thời ở ba cấp độ: công nghệ, phát hành token, và quyết định nâng cấp?Kết luậnGiá giảm của DeepSeek làm nóng lại câu chuyện "dân chủ hóa AI". Nhưng dân chủ hóa suy luận và dân chủ hóa hạ tầng sức mạnh tính toán là hai chuyện khác nhau. Cái trước đang diễn ra; cái sau, phụ thuộc vào việc trong vài năm tới, có bao nhiêu người thực sự coi đó là một bài toán kỹ thuật đáng giải, chứ không chỉ là một câu chuyện hay.

Công suất tính toán đang tập trung lại: Sau khi DeepSeek giảm giá, ai sẽ kiểm soát hạ tầng AI?

Chủ đề thịnh hành

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Ghim