Thời đại AI, "chia sẻ sức mạnh tính toán" là chiếc xe đạp nhỏ của các lập trình viên mới

Nguồn: Geek Park

Viết bởi: Xu Shan

“Chi phí cho Token đang sụt giảm mạnh.”

Nếu câu này được đặt ra cách đây hai năm, nó sẽ khiến mọi nhà khởi nghiệp AI đều phấn khích. Từ năm 2023 đến 2025, chi phí suy luận của AI đã giảm 99,7%. Hãy nhớ rằng, khi GPT-4 ra mắt, chi phí cho mỗi một triệu Token là 37,5 USD; đến năm 2025, con số này đã giảm xuống còn 0,14 USD. Theo xu hướng này, chi phí năng lực tính toán đối với những người khởi nghiệp hẳn sẽ không phải vấn đề.

Nhưng thực tế lại hoàn toàn ngược lại.

Trong cùng giai đoạn đó, chi tiêu AI dạng dịch vụ trên đám mây của doanh nghiệp toàn cầu đã tăng vọt từ 11,5 tỷ USD lên 37 tỷ USD, gấp đúng ba lần. Sau khi AI bước vào thời đại A2A, hàng chục tác nhân tương tác lặp đi lặp lại đã khiến số lần gọi Token bùng nổ theo cấp số nhân. Điều này cũng dẫn đến việc dù đơn giá Token ngày càng rẻ hơn, nhưng lượng Token tiêu thụ cho mỗi tác vụ lại điên cuồng tăng lên.

Rõ ràng, năng lực tính toán đang trở thành nguồn lực kỳ lạ nhất của thời đại này. Nó ngày càng rẻ hơn, nhưng tiền bạn chi cho nó lại chỉ có thể ngày càng nhiều hơn.

Với các “ông lớn”, vấn đề này có thể được giải quyết bằng cách tự xây trung tâm năng lực tính toán. Nhưng với đa số công ty khởi nghiệp, họ chỉ có thể đứng trên thị trường năng lực tính toán công cộng, chấp nhận cách định giá của nhà cung cấp đám mây, nhìn hóa đơn năng lực tính toán tăng từng tháng, mà chẳng có khả năng mặc cả.

Điều mà nhà sáng lập Công ty Công Kỹ Phí (Gongji Keji) – Phù Chí nhìn thấy chính là cơ hội kinh doanh được sinh ra từ sự lệch pha của thị trường này.

Theo ông, lời giải để chi phí năng lực tính toán giảm không chỉ là chờ chi phí tự nhiên giảm đi, mà là thay đổi cách sử dụng năng lực tính toán theo một phương thức khác, từ đó cũng có thể khiến chi phí năng lực tính toán bắt đầu đi xuống. Biến năng lực tính toán như điện: dùng lúc nào cũng có, tính phí theo nhu cầu, và kích hoạt lại phần lớn nguồn lực năng lực tính toán đang bị nhàn rỗi lãng phí.

Gần đây, Công ty Công Kỹ Phí đã hoàn tất vòng tài trợ Pre-A, với định giá sau đầu tư là 350 triệu nhân dân tệ, và dự kiến trong thời gian gần sẽ khởi động vòng A. Trong năm 2025, khi áp lực lên đường đua năng lực tính toán nhìn chung là nặng nề, công ty công nghệ này – dùng phương pháp trí tuệ nhân tạo để giải quyết bài toán điều phối tài nguyên – lặng lẽ đạt doanh thu vài chục triệu nhân dân tệ, tỷ lệ giữ chân khách hàng gần 100%.

Công ty Công Kỹ Phí đang biến điều phối năng lực tính toán thành một hoạt động kinh doanh thật sự.

Nhà sáng lập Công ty Công Kỹ Phí – Phù Chí. Ảnh nguồn: Công ty Công Kỹ Phí

01 Khi công ty AI bùng nổ, bài toán chi phí năng lực tính toán có một lời giải mới

Trước thời điểm ra mắt sản phẩm, đội của Remy gần như không ngủ, luôn sẵn sàng cho những tình huống đột xuất bất cứ lúc nào.

Nhưng khi trang web công ty thực sự đón về 500 nghìn người dùng trong 48 giờ, thì với một công ty AI khởi nghiệp vừa rời giai đoạn nội bộ để bước ra công khai, họ cần trong thời gian ngắn mở rộng quy mô toàn bộ hạ tầng lên hàng chục lần. Mặc dù đã có chuẩn bị, trước khi lên sóng Remy đã thử nghiệm trước nhiều nền tảng dịch vụ đám mây như Ucloud, Alibaba Cloud, Huawei Cloud, v.v.; nhưng đúng khoảnh khắc “lượng truy cập như trút” thật sự ập xuống, thì phương án cuối cùng của họ lại thuộc về Công ty Công Kỹ Phí.

Nói đơn giản, Công ty Công Kỹ Phí làm việc là điều phối năng lực tính toán nhàn rỗi, rồi phân bổ theo nhu cầu cho các doanh nghiệp AI có nhu cầu co giãn. Dù là máy móc chạy không trong tiệm net ban đêm, hoặc GPU 4090 của người dùng cá nhân, hay các tài nguyên rảnh trong phòng máy nhỏ cũng đều có thể trở thành một phần “hồ bơi” năng lực tính toán mà Công ty Công Kỹ Phí có thể điều phối. Nếu khách hàng không đủ dùng, thì bất cứ lúc nào có thể điều thêm trong “hồ bơi” năng lực tính toán; dùng lúc nào lấy lúc đó.

Trong 48 giờ đó, Công ty Công Kỹ Phí đã khẩn cấp điều phối gần 1900 thẻ GPU cho Remy. Mỗi khi người dùng gửi một yêu cầu thì sẽ sinh ra một đơn hàng mới; khi việc tính toán của người dùng hoàn tất, đơn hàng lập tức được đóng lại. Trong ngày hôm đó, nền tảng xử lý hơn một triệu đơn hàng.

“Ở thời điểm cao điểm, các nhà cung cấp dịch vụ năng lực tính toán thông thường tạm thời chỉ có thể mở được tầm 20 thẻ là đã rất khó rồi; trong nhiều trường hợp, doanh nghiệp còn phải chờ, nhưng chờ đợi đồng nghĩa với mất lưu lượng, điều mà doanh nghiệp tuyệt đối không muốn.” Phù Chí nói rằng sau chuyện này, phần lớn năng lực tính toán mà Remy sử dụng đến từ Công ty Công Kỹ Phí.

Nhu cầu của Remy đối với năng lực tính toán thực ra rất đơn giản: mỗi khi bùng nổ lưu lượng, các cú nhấp của người dùng phải được phản hồi kịp thời; việc gọi năng lực tính toán phải nhanh và đúng lúc, đồng thời chi phí phải thấp. Đây đều là những nhu cầu cơ bản nhất về năng lực tính toán đối với các công ty khởi nghiệp AI vừa mới bắt đầu.

Ngược lại, có một nhóm khách hàng ứng dụng AI khác đối mặt với nhu cầu năng lực tính toán nhỏ hơn, nhưng cũng thực tế hơn.

Trong kỳ nghỉ Tết năm ngoái, có một công ty làm AI thay đồ chụp ảnh tại khu du lịch đã tìm đến Công ty Công Kỹ Phí. Họ không phải là không biết khi nào lưu lượng bùng nổ, nhưng vẫn rất khó để tính đúng “bài toán” năng lực tính toán.

Thiết bị AI của họ phần lớn được đặt ở khu du lịch; cứ đến dịp lễ là chật kín người, nhu cầu năng lực tính toán tăng vọt. Nhưng sau khi kỳ nghỉ kết thúc, nhu cầu năng lực tính toán lại gần như bằng không. “Tết là đỉnh lớn nhất trong năm, còn lại hơn nửa năm, trong khu du lịch không có nhiều người.” Họ nói với Phù Chí.

Những biến động như vậy của năng lực tính toán có nghĩa là: nếu chọn thuê năng lực tính toán theo đỉnh, thì tương đương 90% thời gian bình thường đều đang đốt tiền để nuôi thẻ; nếu thuê theo giá trị trung bình, thì trong dịp Tết chắc chắn nhu cầu sẽ sụp đổ, ảnh hưởng đến trải nghiệm người dùng. “Những biến động nhu cầu kiểu này, trong các giải pháp truyền thống về năng lực tính toán, khá khó có được một phương án phù hợp. Vì chênh lệch đỉnh-đáy cực đoan như vậy trong sản phẩm chuẩn hoàn toàn không có logic định giá tương ứng.” Phù Chí nói.

Nhưng tình huống như vậy lại rất phù hợp để sử dụng nền tảng chia sẻ năng lực tính toán của Công ty Công Kỹ Phí.

Trong tháng đó, các node dịch vụ thay 1963 máy tính cá nhân; suốt cả dịp Tết, không hề xuất hiện một lần nào vấn đề về độ ổn định. “So với việc khách hàng tự triển khai theo đỉnh, chúng tôi giúp họ tiết kiệm gần 70% chi phí.” Phù Chí bổ sung.

Nhu cầu biến động theo thời gian như thế này không chỉ xuất hiện trong một số bối cảnh dọc nhỏ lẻ; nó cũng tương tự, thậm chí rất phổ biến, đối với nhiều công ty “tân binh” AI.

liblib là một trong những nền tảng tạo ảnh AI có lượng người dùng trong nước lớn nhất. Họ từng thuê một lượng lớn thẻ GPU trên nền tảng của các nhà cung cấp đám mây. Nhưng nếu nghiên cứu kỹ, họ phát hiện rằng khi tính trung bình, mức sử dụng tổng thể của các GPU đó chỉ là 45%.

Điều này cũng đồng nghĩa với việc hơn một nửa số thẻ mỗi ngày đều đang vô cớ đốt tiền.

Theo Phù Chí, thực ra các doanh nghiệp như liblib không phải là hiếm; hầu như mọi công cụ ứng dụng AI với nhóm người dùng chính là dân văn phòng đều gặp vấn đề này. Ban ngày người dùng dày đặc sử dụng, ban đêm lượng người dùng giảm mạnh. Nếu phân bổ năng lực tính toán theo đỉnh, thì ban đêm tỷ lệ nhàn rỗi cao; nhưng nếu phân bổ theo trung bình, thì ban ngày sẽ khó đáp ứng đầy đủ nhu cầu của tất cả người dùng.

Đường đua AI nhìn thì rất sôi động, nhưng thứ có thể làm “kẹt” đường sống của công ty lại có thể chính là bài toán chi phí năng lực tính toán. Nhiều doanh nghiệp đặt kỳ vọng quá cao vào năng lực tính toán; chi phí năng lực tính toán kéo sập dòng tiền. Cũng có doanh nghiệp dự đoán năng lực tính toán thiếu hụt; đến lúc “đỉnh” về mức sử dụng thì dịch vụ sập, người dùng đi rồi không quay lại.

“Lưu lượng của các ứng dụng AI vốn dĩ đã dao động; logic định giá của thị trường năng lực tính toán được thiết kế cho nhu cầu ổn định, và cách phân bổ chi phí năng lực tính toán vẫn luôn dừng ở một phương thức khá truyền thống.” Phù Chí nói. Đây cũng là lý do vì sao khi một công ty AI thực sự bùng nổ, bài toán chi phí năng lực tính toán cần một thuật toán mới.

Trước đây, mô hình dịch vụ năng lực tính toán truyền thống chủ yếu dựa trên hợp đồng thuê dài hạn. Doanh nghiệp thuê trong một năm; dù có dùng hay không, vẫn phải trả trước chi phí cho năng lực tính toán. Chi phí của phần năng lực tính toán nhàn rỗi chủ yếu do chính doanh nghiệp gánh chịu. Còn việc mà Công ty Công Kỹ Phí làm thực chất là chuyển khoản chi phí này sang nơi khác: đó là những người vốn đã có năng lực tính toán nhàn rỗi nhưng không thể chạy hết, như người dùng cá nhân, tiệm net, v.v. Những năng lực tính toán này vốn dĩ đã bị lãng phí; việc điều phối chúng sẽ không tạo ra chi phí năng lực tính toán mới, đồng thời “hồi sinh” phần năng lực tính toán nhàn rỗi đã tồn tại sẵn.

“Không phải càng nhiều năng lực tính toán thì càng tốt.” Phù Chí nói, “mà là nó có thể lưu động, có thể gọi bất cứ lúc nào thì mới tốt.”

02 Kinh doanh năng lực tính toán co giãn này, thử thách năng lực điều độ năng lượng

Với Phù Chí, cơ hội để làm kinh doanh điều phối năng lực tính toán thực ra đến từ một dịp tình cờ.

Tháng 5 năm 2023, vào kỳ nghỉ, đúng lúc cơn sóng AI vừa bắt đầu manh nha, Phù Chí đăng một thông báo vào một cộng đồng người khởi nghiệp AI. Nội dung rất đơn giản: “Tôi có một chiếc A100; thuê càng ngắn thì càng rẻ. Ai cần thì đến tìm tôi.”

Lúc đó, dự đoán của chính ông không kỳ vọng quá nhiều, dù chỉ có một thẻ. Nhưng kết quả lại ngoài dự liệu: cuối cùng có 30 người hỏi tư vấn, và tất cả đều sẵn sàng trả tiền rất nhanh.

“Ai trả tiền nhanh thì tôi phục vụ người đó.” Cuối cùng ông chọn phục vụ 5 người. Một thẻ, 5 khách hàng. Điều này đã xác minh một phán đoán mà ông đã nghĩ rất lâu: người bình thường bắt đầu cần đến năng lực tính toán.

Nhưng ông cũng hiểu rõ rằng, lý do tại sao kinh doanh này chỉ hình thành ở thời điểm đó không phải vì ông gặp may, mà vì trước đó hoàn toàn không có điều kiện để làm.

Dù từ năm 1999 đã từng có người đề xuất chia sẻ năng lực tính toán, xây dựng nền tảng BOINC, hàng chục vạn người đóng góp năng lực tính toán; nhưng lúc đó làm nền tảng tính toán khoa học mang tính phi lợi nhuận, ai cũng có thể dùng miễn phí. Sau này khi Bitcoin bùng nổ, cũng có người cân nhắc mượn “cơn sốt đào coin” để điều phối năng lực tính toán nhàn rỗi, nhưng điều đó không hợp pháp.

Ý tưởng vẫn luôn có, nhưng “đất” vẫn chưa có.

Bởi vì người dùng phổ thông thật sự có GPU hiệu năng cao chủ yếu thuộc thế hệ 90 và 00. Trước thời đó, rất ít người có cấu hình máy tính cá nhân trang bị 4090. Và việc chạy an toàn trên máy tính cá nhân môi trường ảo Linux qua WSL 1.0.0 cũng mãi đến năm 2022 mới chính thức phát hành. Chưa nói đến việc gọi từ xa các thiết bị cá nhân đặt khắp nơi để nó có thể xuyên qua mạng nội bộ (NAT/port), thứ công nghệ đó phải đến khoảng năm 2021 mới thật sự trưởng thành.

Ba thứ: phía cung, phía cầu, và điều kiện kỹ thuật — cùng đủ cả — mới khiến việc kinh doanh này trở nên khả thi ngày nay.

Nhưng theo Phù Chí, tín hiệu để ông thực sự nhận ra “đến lúc rồi” không phải DeepSeek, không phải máy tích hợp một thể, mà là các bối cảnh tiêu dùng của AI: đang thấm từ công cụ dành cho thiểu số vào đời sống giải trí hằng ngày của người bình thường.

“Chỉ cần quá trình này tăng tốc, thì nhu cầu về năng lực tính toán sẽ không còn là việc vài công ty lớn mua sắm nữa, mà cần giống như điện: được điều độ và phân phối trên quy mô lớn, xuyên qua nhiều node.” Phù Chí nói.

Đó cũng là lý do Công ty Công Kỹ Phí đang thúc đẩy hợp tác với Trung tâm Năng lực Tính toán của Nhà nước. Hiện tại, họ đã tham gia vào việc xây dựng các nền tảng điều phối năng lực tính toán cấp tỉnh cho Kinh-Bắc Kinh-Thiên Tân-Hà Bắc, đồng bằng sông Dương Tử (Trường Giang), Thâm Quyến, Thanh Hải. Hệ thống điều phối do các nơi dựng lên, về mặt kỹ thuật đều có sự tham gia của Công ty Công Kỹ Phí.

Tuy nhiên, “điều phối năng lực tính toán” lại khó hơn rất nhiều so với vẻ bề ngoài.

Điều phối năng lực tính toán và quản lý năng lực tính toán không phải là một khái niệm đồng nhất. Phù Chí phân biệt hai việc này: các “đại gia” làm quản lý, đưa một đống máy vào cùng một hệ thống, biết ai đang dùng và ai đang rảnh, nhưng rất khó thực hiện việc phân bổ động xuyên vùng và xuyên thiết bị.

Còn điều phối năng lực tính toán là chuyện khác. Nó cần dùng năng lực tính toán nhàn rỗi ở nơi khác để bù vào nhu cầu đỉnh ở nơi này. Trong kỹ thuật máy tính, thực ra không có sẵn lời giải; ngược lại, đó lại là bài toán cũ của lĩnh vực năng lượng. “Cắt đỉnh bù đáy” là thuật ngữ của hệ thống điện.

Phù Chí học đại học chuyên ngành môi trường xây dựng và ứng dụng năng lượng tại Thanh Hoa (Tsinghua), và giảng viên hướng dẫn của ông là một viện sĩ trong lĩnh vực năng lượng. Ông đã di chuyển thuật toán điều độ năng lượng sang để giải quyết cùng một vấn đề ở phiên bản năng lực tính toán; đây cũng là bức tường thành cốt lõi nhất của Công ty Công Kỹ Phí.

Tất nhiên, trong quá trình hiện thực hóa thành hệ thống kỹ thuật, hệ thống điều phối xuyên vùng như vậy cũng gặp không ít rắc rối. Ví dụ: các máy tính cá nhân được kết nối vào “pool” điều phối có thể bất cứ lúc nào bị “chiếm dụng”. Khi người dùng vừa mở game, máy đó cần phải thoát ra, nhưng các khách hàng phía dưới lại yêu cầu dịch vụ không được gián đoạn.

Phù Chí chọn giải pháp “dự phòng nóng + dự đoán”, tức là chuẩn bị sẵn các node dự phòng cho mỗi tác vụ, đồng thời dùng dữ liệu lịch sử tích lũy để dự đoán quy luật online của từng nguồn cung, từ đó điều chỉnh tỷ lệ dự phòng một cách động. Dữ liệu càng nhiều, dự phòng càng chính xác, chi phí càng thấp. “Trước kia tôi cần phải dự phòng cho anh hai máy. Nhưng khi sử dụng, giờ tôi chỉ cần dự phòng một máy là đủ.” Lớp truyền tải mạng cũng không ổn định; cách ứng phó của Công ty Công Kỹ Phí là đồng thời kết nối ba nhà cung cấp đám mây hàng đầu. Phù Chí nói: “Không thể cùng lúc tất cả đều gặp vấn đề.”

Vậy tại sao các nhà cung cấp đám mây lại không làm năng lực tính toán co giãn?

Phù Chí đưa ra giải thích: các “đại gia” đã nhìn thấy, nhưng năng lực tính toán co giãn của họ lại khác về định vị sản phẩm và chiến lược định giá; ưu thế của Công ty Công Kỹ Phí nằm ở giá cả và hiệu quả điều phối.

Mâu thuẫn cốt lõi của năng lực tính toán co giãn là: bạn phải dự phòng trước năng lực tính toán “có thể gọi bất cứ lúc nào”. Nhưng khi không ai dùng, những năng lực tính toán đó lại chỉ là chi phí nhàn rỗi thuần túy. Thông thường việc mở rộng linh hoạt của nhà cung cấp dịch vụ năng lực tính toán sẽ xấp xỉ gấp 5 lần so với giá thông thường, hoặc yêu cầu khách hàng ký hợp đồng dài hạn một năm, để khách chịu rủi ro nhàn rỗi của năng lực tính toán.

Công ty Công Kỹ Phí sở dĩ có thể cung cấp “đúng nghĩa” năng lực tính toán co giãn là vì các nguồn lực họ dùng vốn dĩ là nhàn rỗi. Những nguồn lực này không được mua trước để ép chi phí, chúng vốn dĩ đã đang rảnh; vì thế Công ty Công Kỹ Phí có thể đưa ra mức giá ưu thế hơn.

Theo Phù Chí phân tích, trong toàn thị trường có 80% nhu cầu năng lực tính toán đi theo hình thức thuê trọn gói dài hạn của các “đại gia”; phần còn lại 20% là nhu cầu có tính co giãn. Phù Chí không định giành lấy 80% đó; ông tập trung hơn vào thị trường của 20%, và theo đà các ứng dụng AI tiếp tục phát triển, quy mô thị trường của 20% này cũng sẽ ngày càng lớn. “Ở chỗ người khác, thuê càng dài thì càng rẻ; ở chỗ tôi, thuê càng ngắn thì càng rẻ.” Phù Chí bổ sung. Hiện nay, nền tảng chia sẻ năng lực tính toán của Công ty Công Kỹ Phí là “suanli.cn” cho phép người tiêu dùng bình thường thuê năng lực tính toán liên quan theo đơn vị mili-giây.

Đội ngũ Công ty Công Kỹ Phí chụp ảnh chung. Ảnh nguồn: Công ty Công Kỹ Phí

Mô hình kinh doanh chia sẻ như vậy thực ra đã từng được kiểm chứng ở những lĩnh vực khác từ lâu.

Phù Chí ví bản chất của việc kinh doanh này giống Airbnb: khi thành phố tổ chức một triển lãm lớn, các khách sạn xung quanh đều kín phòng; Airbnb kết nối cư dân có phòng nhàn rỗi với những người tham dự không tìm được chỗ ở. Câu chuyện bản năng lực tính toán cũng đi theo cùng một lộ trình: tại thời điểm phát hành phiên bản và khi lưu lượng bùng nổ, các ứng dụng AI cần một lượng lớn năng lực tính toán; còn vào các thời điểm bình thường, nhu cầu nhỏ hơn rất nhiều. Ở phía còn lại, năng lực tính toán của người dùng cá nhân, tiệm net, phòng máy nhỏ lại bị nhàn rỗi rất nhiều vào ban đêm và ngày thường. Kết nối hai phía này chính là điều mà Công ty Công Kỹ Phí đang làm.

Chỉ khác là, thứ được chia sẻ không phải phòng, mà là năng lực tính toán.

03 Điều phối năng lượng cho năng lực tính toán: “Cơ sở hạ tầng được định nghĩa bằng phần mềm” của thời đại AI

Con đường này cũng đã có người đi ở nước ngoài. Ví dụ: RunPod cũng cung cấp dịch vụ suy luận co giãn thông qua năng lực tính toán phân tán nhàn rỗi. Năm 2024, họ nhận được vòng hạt giống (seed round) trị giá 20 triệu USD đồng do Intel Capital và Dell Technologies Capital dẫn dắt; khách hàng gồm Cursor, OpenAI, Perplexity.

Nhưng theo Phù Chí, làm việc này ở Mỹ và làm ở Trung Quốc hoàn toàn là hai chuyện khác nhau.

AWS ngay từ khi ra đời đã cung cấp năng lực tính toán co giãn; ngay từ đầu họ cam kết dùng theo nhu cầu, phục vụ thị trường trưởng thành thông qua dịch vụ co giãn giá cao. Trong khi các nhà cung cấp điện toán đám mây trong nước lại có xu hướng cung cấp mô hình thuê dài hạn, các chính sách ưu đãi cũng nghiêng về hướng đó, và không mấy coi trọng dịch vụ co giãn; mức sẵn sàng chi trả của người dùng cho năng lực tính toán co giãn cũng thấp hơn nhiều so với Mỹ. Vì vậy, nếu đem logic của RunPod “copy” sang trong nước, thì định giá sẽ không chạy được.

Tuy nhiên, Phù Chí cho rằng điều phối năng lực tính toán không phải chỉ là một ngành kinh doanh nhìn vào việc cho thuê năng lực tính toán. “Chia sẻ năng lực tính toán có thể chỉ là một ‘cánh cửa mở’.” Khi nói câu này, ông không hề do dự. Theo đánh giá của ông, kinh doanh này có lẽ có một “cửa sổ” khoảng hai đến ba năm. Chỉ cần sự lệch pha giữa cung và cầu năng lực tính toán còn tồn tại, khoảng trống này vẫn sẽ tồn tại; nhưng nó sẽ không tồn tại mãi mãi.

Sự tỉnh táo này không phổ biến trong giới khởi nghiệp. Nhưng chính vì vậy, ông rất sớm đã bắt đầu nghĩ đến một việc căn bản hơn: ứng dụng AI bùng nổ thật sự tiếp theo sẽ mọc lên từ đâu? Phán đoán này sẽ trực tiếp quyết định hướng đi của nhu cầu năng lực tính toán; về vấn đề này, Phù Chí có hai đánh giá cho tương lai.

Thứ nhất, theo phân tích của ông, các “siêu ứng dụng” ở Trung Quốc sẽ không mọc lên từ các công cụ năng suất trên PC; hướng có cơ hội thực sự là giải trí xã hội trên thiết bị di động, kết hợp phần cứng xuyên biên giới của chuỗi cung ứng, và các ứng dụng AI có thể được nhúng vào các bối cảnh đời sống thực.

Internet Trung Quốc chưa bao giờ trải qua thời đại công cụ năng suất trên PC dày dặn như ở nơi khác. Người dùng trực tiếp nhảy từ thời kỳ máy tính tính năng (feature phone) sang internet trên điện thoại di động. Những tài liệu AI, slide AI, trợ lý viết code AI chạy ở Mỹ phía sau phụ thuộc vào một nhóm người dùng quen làm việc trên PC, sẵn sàng trả phí cho các công cụ SaaS; còn ở Trung Quốc thì không phải vậy. “Cả Trung Quốc có hơn 100 triệu người cần phải viết Word không? Tôi nghĩ có lẽ không.” Rắc rối hơn là, ngay cả khi có nhu cầu đó, các “đại gia” cũng sẽ nhanh chóng biến những chức năng này thành plugin miễn phí.

Ông ngược lại nhìn thấy đà tăng trưởng cao trong bối cảnh giải trí xã hội. Ông đã trò chuyện với rất nhiều người làm phim ngắn và hỏi họ vì sao lại tích cực ôm AI. Phản hồi của họ khiến ông có thêm ý tưởng mới: “Tôi không còn gì để mất nữa. Không ai đi xem phim và phim truyền hình nữa, chúng tôi sắp chết rồi.” Những người này là nhóm tích cực nhất trong việc ôm AI ở thị trường Trung Quốc, không phải vì họ hiểu kỹ thuật nhất, mà vì họ không còn đường lui. “Giờ gần như không còn ai xem TV nữa, không còn ai xem phim điện ảnh.”

Đối với sự phát triển của phần cứng AI, ông cũng có một vài quan điểm khác.

Trong vài năm qua, hướng chủ đạo của phần cứng AI là “gắn mọi thứ với một ô hội thoại”: tức là thiết bị nào cũng kèm một cửa sổ chat. Phù Chí cho rằng hướng đó không đúng. “Người tiêu dùng không cần một chiếc tủ lạnh biết làm thơ.”

Phần cứng AI thực sự có sức sống là đi vào các ngữ cảnh tần suất cao mà người dùng vốn đã có sẵn, để AI âm thầm vận hành phía sau, thay vì kéo người dùng ngồi xuống và trò chuyện riêng với nó.

Giống như camera cho thú cưng nên tự động nhận biết mèo có đang bệnh hay không; máy ảnh ở khu du lịch tự động hoàn thành chụp ảnh thay đồ. Người dùng chẳng cần thay đổi gì, AI lặng lẽ làm xong việc. “Nếu loại phần cứng này có thể triển khai bằng mô hình mã nguồn mở, thì vào thời điểm lưu lượng bùng nổ, nó cũng sẽ trở thành một khách hàng của năng lực tính toán co giãn.” Phù Chí nghĩ rằng đây cũng là một trong các điểm tăng trưởng trong tương lai của Công ty Công Kỹ Phí.

Phán đoán thứ hai của Phù Chí còn “giấu” sâu hơn; đến cuối năm 2024 nó đã hình thành, nhưng ông phải đợi đến năm nay mới có cơ hội để kiểm chứng.

Ông cho rằng, việc để con người trực tiếp đối thoại với AI vốn dĩ là một kiểu lãng phí hiệu suất. Tốc độ nhập/xuất thông tin của con người có giới hạn; mỗi lần chỉ có thể nêu một câu hỏi, và phải chờ câu trả lời xuất hiện rồi mới hỏi câu tiếp theo. Nhưng AI có thể đồng thời xử lý hàng chục nghìn luồng (thread), hoàn thành việc truyền thông tin giữa các máy chỉ trong vài mili-giây. “Dùng con người để điều khiển AI là dùng mắt xích chậm nhất để kéo cả hệ thống, làm chậm tốc độ của toàn bộ hệ thống.”

Thứ thực sự nên xảy ra là AI cộng tác trực tiếp với AI, tức A2A. Một tác vụ được đưa ra sẽ kích hoạt chuỗi vận hành liên tiếp của một nhóm AI; con người chỉ cần xác định mục tiêu, không cần tham gia vào từng bước trung gian. Đây cũng là lý do vì sao OpenClaw ngày nay được mọi người coi trọng. Và đây cũng là lý do khiến Phù Chí cho rằng OpenClaw thực sự quan trọng: không phải vì bản thân sản phẩm đó, mà vì nó chứng minh một điều rằng AI và AI có thể tự hình thành một cộng đồng, và có người trả tiền cho A2A—hướng đi này là khả thi.

Khi mô hình A2A trở thành xu hướng chủ đạo, mức tiêu hao năng lực tính toán sẽ là vài lần đến hàng chục lần so với ngày nay. Trên GTC 2026, Hoàng Nhân Tuân (Jensen Huang) nói rằng do sự bùng nổ của Agentic AI và năng lực suy luận, lượng tính toán cần thiết hiện tại đã nhiều hơn ít nhất 100 lần so với dự đoán một năm trước, và đó mới chỉ là bắt đầu. Lúc đó, năng lực tính toán thật sự sẽ giống như điện: thứ cần cân nhắc không còn là bạn cần “tích trữ” bao nhiêu thẻ, mà là liệu cả “lưới điện năng lực tính toán” có thể phân phối theo nhu cầu hay không; quản lý tài nguyên năng lực tính toán bước sang lĩnh vực điều độ.

Khi A2A thật sự đến, năng lực tính toán sẽ trở thành cơ sở hạ tầng đứng phía sau mỗi người, mỗi tác vụ, mỗi node AI giống như điện. Khi đó, ai có thể điều phối chính xác năng lực tính toán một cách xuyên vùng, xuyên thiết bị, xuyên khung thời gian, thì người đó sẽ nắm quyền vận hành thực sự của “tấm lưới” này.

Theo Phù Chí, những gì Công ty Công Kỹ Phí đang làm hiện nay là để chuẩn bị cho khoảnh khắc đó: tận dụng “cửa sổ” hai đến ba năm này để xây dựng năng lực điều độ, mạng lưới node và mối quan hệ với khách hàng. Chỉ khi nhu cầu A2A bùng nổ thực sự, bộ hệ thống này mới là “hào” bảo vệ thực sự của Công ty Công Kỹ Phí.

Gần đây ông có gửi một câu nói trong nội bộ công ty; khi cuộc phỏng vấn gần kết thúc, ông lại nói lại một lần nữa:

“Dù vậy, mọi thứ này vẫn mới chỉ bắt đầu.”

Đặt trong ngữ cảnh của năng lực tính toán co giãn, câu nói này có lẽ chỉ là một nhận định lạc quan của một người khởi nghiệp về thị trường. Nhưng đặt trong ngữ cảnh của A2A, “bắt đầu” mà ông nói có lẽ không phải là bắt đầu của riêng “công việc kinh doanh” này; mà là thời điểm mệnh đề “năng lực tính toán như một cơ sở hạ tầng” thật sự bước vào giai đoạn bắt đầu.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim