Theo báo cáo chuyên sâu của CNBC, trong hai cuộc họp kín tại Thung lũng Silicon diễn ra trong tuần này, nhiều CEO startup AI và các kỹ sư đã thẳng thắn nêu ra rằng việc triển khai quy mô các AI agent hiện tại đang gặp hai vấn đề mang tính cấu trúc: “lãng phí token một cách khổng lồ” và “hỗn loạn cực độ giữa các hệ thống”. Bản ghi nhận tại hiện trường này lại tương phản rõ rệt với kỳ vọng lạc quan rằng AI agent là “ChatGPT tiếp theo” do CEO Nvidia Hoàng Nhân Huân nêu vào tháng 3, cho thấy điểm nghẽn thực sự của đường đua này không nằm ở năng lực tính toán, mà nằm ở thiết kế ra quyết định, hiệu quả token và tích hợp nhiều hệ thống.
Vấn đề lớn nhất là đem mọi thứ giao cho LLM
CEO startup AI Meibel là Kevin McGrath cho biết tại cuộc họp: “Vấn đề lớn nhất mà chúng tôi đang xử lý ngay bây giờ là hiểu nhầm rằng mọi thứ đều cần được mô hình ngôn ngữ lớn xử lý — dồn tất cả token và tất cả tiền vào một bot AI, thì nó sẽ đốt cháy hàng triệu token.” Ông nhấn mạnh rằng khi thiết kế workflow cho agent, doanh nghiệp phải đánh giá rõ hơn đâu là những nhiệm vụ thật sự cần LLM, còn những việc nào có thể hoàn thành bằng logic theo quy tắc rẻ hơn hoặc máy học truyền thống.
Nhận định này trùng khớp với phản ứng của thị trường sau khi Anthropic Claude phiên bản doanh nghiệp chuyển sang tính phí theo mức sử dụng — khi mức tiêu hao token trực tiếp trở thành chi phí, mô hình phát triển “mù quáng đưa cho agent” lập tức bộc lộ áp lực tài chính. Quan điểm của Meibel đại diện cho một nhóm kỹ sư thực dụng đi ngược trào lưu hype: nghệ thuật trong kiến trúc agent nằm ở việc ràng buộc, chứ không phải buông thả.
Hệ thống phối hợp đa agent phụ thuộc lẫn nhau tạo thành hỗn loạn
Tờ CNBC cũng lặp lại một từ khóa quan trọng khác là “chaotic”. Khi doanh nghiệp đồng thời vận hành nhiều AI agent — chẳng hạn một agent xử lý chăm sóc khách hàng, một agent xử lý lên lịch, một agent xử lý tài chính — việc truyền thông điệp, tính nhất quán trạng thái, và cách phản hồi lỗi giữa các agent sẽ tác động qua lại lẫn nhau, và chỉ cần một agent hoạt động trục trặc cũng có thể lan truyền theo chuỗi. Karpathy trong tuần này cũng nhắc đến việc cá nhân ông vận hành workflow với đồng thời 10–20 agent, nhưng thừa nhận rằng quy trình code review và PR trở thành nút thắt mới.
Sự hỗn loạn của các hệ thống đa agent như vậy, về bản chất, là bài toán cũ của hệ thống phân tán được lặp lại trong thời đại LLM: không có SLA rõ ràng, không có ranh giới giao dịch, không có ngữ nghĩa cho việc thử lại khi thất bại. Dù Anthropic và OpenAI đã cho ra mắt các lớp giao thức như MCP, Agent SDK, nhưng trong triển khai thực chiến tại doanh nghiệp, việc tiêu chuẩn hóa vẫn còn tụt xa so với tốc độ tăng trưởng về số lượng agent.
Học thuyết lương token 250.000 USD của Hoàng Nhân Huân bị nguội lạnh
CEO Nvidia là Hoàng Nhân Huân trong tháng 3 tại GTC và các cuộc phỏng vấn tiếp theo đã ra sức quảng bá khái niệm “lương token”, khẳng định: “Nếu một kỹ sư có lương năm 500.000 USD mà không tiêu thụ ít nhất 250.000 USD token, thì tôi sẽ cảm thấy rất bất an.” Lập luận của ông là: kỹ sư nên dùng AI agent để thay thế các thao tác cấp thấp của chính mình, và “lượng tuyệt đối token tiêu hao” chính là chỉ số đại diện cho năng suất lao động. Luận điểm này có thể tham khảo trong chuyên phỏng vấn mới nhất của Hoàng Nhân Huân (phần 1) về phần trình bày đầy đủ nhu cầu năng lực tính toán AI.
Nhưng các ý kiến tại hiện trường trong báo cáo của CNBC cho thấy cộng đồng kỹ sư ở Thung lũng Silicon ngày càng giữ thái độ dè chừng: việc tiêu hao token nhiều hay ít không đồng nghĩa với năng suất lao động, thậm chí còn có thể là dấu hiệu của thiết kế agent kém. Giá trị thực sự của kỹ sư vẫn nằm ở “quyết định nhiệm vụ nào đáng để gọi agent, cách chia tách nhiệm vụ, và cách thiết kế xử lý lỗi” — những công việc này bản thân không thể đo được bằng lượng tiêu hao token.
Giao điểm Crypto và AI agent vẫn cần thời gian
Đối với ngành crypto, các xu hướng trong tuần này như việc AI ngốn 80% vốn đầu tư mạo hiểm toàn cầu, cũng như các dự án DeFi chủ động tích hợp các agent tự chủ, đều dựa trên giả định rằng “công nghệ agent đã đạt đến mức có thể triển khai”. Nhưng bài báo của CNBC nhắc nhở: ngay cả trong môi trường doanh nghiệp thuần web2, hiệu quả token của agent và việc tích hợp đa hệ thống vẫn chưa ổn định. Việc đưa agent vào môi trường blockchain vận hành 24/7, nơi tài sản có thể bị đánh cắp ngay lập tức, thì rủi ro kỹ thuật và rủi ro tài chính đều sẽ được khuếch đại. Điểm khởi đầu thật sự của Crypto × AI có thể còn phải chờ đến khi các lớp khung cho agent (như MCP, LangGraph, Cloudflare Agents) đạt đến độ chín về tiêu chuẩn hóa.
Bài viết này “Thực tế về AI Agent tại Thung lũng Silicon: Lãng phí token rất nhiều, tích hợp hệ thống “cực kỳ hỗn loạn”, dự đoán của Hoàng Nhân Huân “ChatGPT tiếp theo” cần được kiểm chứng” lần đầu tiên xuất hiện tại 鏈新聞 ABMedia.
Bài viết liên quan
Báo cáo mới nhất của A16z: Tại sao blockchain là mảnh hạ tầng còn thiếu đối với các tác nhân AI?
Moonshot AI Ra mắt Kimi K2.6 với Năng lực Nâng cao về Lập trình và Agent
Adobe Mở Rộng Hệ Sinh Thái AI Tác Nhân, Hợp Tác với OpenAI, AWS và Các “Ông Lớn” Thanh Toán
Morgan Stanley Dự Báo AI Tác Nhân Có Thể Bổ Sung $60B $32.5B- Vào Thị Trường CPU Tới Năm 2030
AI Agents Sẽ Tái Định Hình Mô Hình Giao Dịch; Onchain OS Xây Nền Tảng Hạ Tầng