Trong hội thảo “Big Ideas for 2026” do Andreessen Horowitz tổ chức, các nhà đầu tư mạo hiểm hàng đầu đã vẽ ra một tầm nhìn đột phá về tương lai: trí tuệ nhân tạo sẽ không còn là một công cụ thụ động chờ lệnh nữa, mà trở thành một tác nhân tự chủ có khả năng dự đoán nhu cầu và hoạt động độc lập. Ba sự thay đổi căn bản sẽ đánh dấu bước chuyển này, với những tác động vượt xa lĩnh vực kỹ thuật.
Giao diện sẽ biến mất: khi các tác nhân thay thế lệnh
Marc Andrusko, đối tác của nhóm đầu tư ứng dụng AI tại a16z, đưa ra một luận điểm gây tranh cãi: đến năm 2026, ô nhập liệu sẽ không còn là trung tâm của tương tác giữa con người và máy móc nữa. Các ứng dụng thế hệ mới sẽ không còn yêu cầu người dùng cung cấp hướng dẫn rõ ràng nữa, mà sẽ quan sát hành vi của họ, chủ động can thiệp và đề xuất các kế hoạch hành động để người dùng phê duyệt.
Phía sau sự thay đổi về mô hình này là một bước nhảy lượng tử trong giá trị tiềm năng của AI. Andrusko nhận thấy rằng thị trường các tác nhân không cần cạnh tranh trong khoản chi tiêu phần mềm toàn cầu hàng năm 300-400 tỷ đô la, mà trong khối lượng của kim tự tháp chi tiêu cho lực lượng lao động: chỉ riêng tại Hoa Kỳ, con số này là 13 nghìn tỷ đô la. Điều này đồng nghĩa với việc mở rộng cơ hội thị trường khoảng 30 lần.
Để hiểu mô hình lý tưởng, Andrusko lấy ví dụ về một loại nhân viên con người. Những người ít chủ động hơn sẽ xác định vấn đề và yêu cầu hướng dẫn. Những người ở đỉnh của kim tự tháp—cấp S—sẽ xác định vấn đề, chẩn đoán nguyên nhân, nghiên cứu các giải pháp thay thế, thực hiện chúng và chỉ quay lại chủ sở hữu để xin phê duyệt cuối cùng. “Đây,” Andrusko nói, “là tương lai của các ứng dụng AI.” Các mô hình ngôn ngữ lớn (LLM) ngày càng trở nên nhanh hơn, rẻ hơn và tinh vi hơn; người dùng vẫn sẽ yêu cầu một bước xác nhận cuối cùng trong các tình huống rủi ro cao, nhưng các mô hình đã có thể đề xuất các gợi ý thông minh và chỉ cần một cú nhấp chuột để xác nhận.
Các ứng dụng như CRM tích hợp AI bản địa minh họa cho sự chuyển đổi này. Ngày nay, một nhân viên bán hàng mở hệ thống và tự quyết định các hành động cần thực hiện. Ngày mai, tác nhân AI sẽ liên tục quét các cơ hội, xem xét hai năm email để tìm lại các khách hàng tiềm năng bị bỏ quên, đề xuất các bước theo dõi kịp thời và tổ chức lịch trình. Nhập liệu của con người sẽ trở thành một ngoại lệ, chứ không phải quy luật.
Thiết kế cho máy móc, không phải cho con người: machine legibility là trung tâm
Stephanie Zhang, đối tác tăng trưởng của a16z, giới thiệu một nguyên tắc thiết kế đột phá: phần mềm sẽ không còn tối ưu cho mắt người nữa, mà cho khả năng hiểu tự động. Những gì phù hợp cho tiêu thụ của con người có thể không quan trọng đối với các tác nhân, và ngược lại.
Zhang nhắc lại các nguyên tắc cơ bản của báo chí: bắt đầu bằng “5W và 1H” để thu hút sự chú ý của con người, vì độc giả thường bỏ qua các chi tiết nằm sâu trong các trang sau. Tuy nhiên, các tác nhân sẽ đọc từng từ của một bài báo với cùng mức độ nhấn mạnh. Trong nhiều năm, các tổ chức đã tối ưu hóa mọi giao diện để phù hợp với nhấp chuột của con người và các bảng điều khiển trực quan. Với sự trỗi dậy của các tác nhân, hệ thống phân cấp thị giác sẽ mất đi trọng lượng trước machine legibility—tiêu chuẩn mới của tối ưu hóa.
Ngay cả ngày nay, các kỹ sư về độ tin cậy hệ thống không còn lật trang các bảng điều khiển Grafana nữa; các SRE AI nhận dữ liệu telemetry, phân tích và báo cáo giả thuyết trực tiếp trên Slack. Các nhóm bán hàng không còn duyệt CRM thủ công nữa; các tác nhân tổng hợp dữ liệu và tóm tắt lại để con người dễ đọc hơn. Thiết kế trực quan, vốn là ưu tiên hàng đầu, sẽ nhường chỗ.
Câu hỏi then chốt vẫn còn bỏ ngỏ: các tác nhân đang tìm kiếm điều gì? Chúng ta vẫn chưa chắc chắn. Nhưng Zhang dự đoán một rủi ro rõ ràng: vì chi phí sản xuất nội dung gần như bằng không và các tổ chức sẽ cạnh tranh để thu hút sự chú ý của các tác nhân, sẽ xuất hiện các khối lượng nội dung siêu cá nhân hóa và tần suất cao, một dạng “nhồi nhét từ khóa của thời đại tác nhân”. Hiện tượng này sẽ thay đổi cách chúng ta tạo nội dung và các công cụ chúng ta sử dụng.
Từ khoa học viễn tưởng đến thị trường thực tế: bùng nổ các tác nhân thoại
Olivia Moore, đối tác của nhóm đầu tư ứng dụng AI tại a16z, ghi nhận một hiện tượng đã diễn ra: các tác nhân thoại đang chuyển từ trình diễn kỹ thuật sang phân phối doanh nghiệp quy mô lớn. Các công ty thực tế, trong gần như mọi ngành, đang thử nghiệm và triển khai hệ thống voice AI.
Ngành y tế là lĩnh vực năng động nhất. Các tác nhân thoại quản lý các cuộc gọi đến các công ty bảo hiểm, nhà thuốc, nhà cung cấp và thậm chí tương tác trực tiếp với bệnh nhân: từ lập lịch hẹn đến theo dõi sau phẫu thuật, đến các cuộc tư vấn tâm thần ban đầu. Yếu tố thúc đẩy chính? Tỷ lệ thay thế cao và khó tuyển dụng trong ngành. Các tác nhân thoại mang lại độ tin cậy và khả năng mở rộng nơi thiếu hụt nhân lực.
Trong lĩnh vực ngân hàng và dịch vụ tài chính, trực giác lại trái ngược: voice AI vượt trội hơn con người. Trong khi con người thường mắc lỗi tuân thủ quy định, các tác nhân thoại tuân thủ chính xác các quy tắc, và mọi tương tác đều có thể theo dõi được. Ưu điểm về tuân thủ quy định này thay đổi cảnh quan cạnh tranh.
Trong tuyển dụng, từ các vị trí cấp thấp trong bán lẻ đến các vai trò tư vấn trung cấp, voice AI cung cấp cho ứng viên các cuộc phỏng vấn bất cứ lúc nào, rồi đưa họ vào quy trình tuyển chọn của con người. Ngành BPO và trung tâm cuộc gọi sẽ trải qua một quá trình chuyển đổi. Một số sẽ giảm dần, số khác sẽ sụp đổ nhanh hơn. Như một câu ngạn ngữ trong ngành nói: “AI sẽ không lấy đi công việc của bạn; người dùng AI mới là người mất việc.” Trong ngắn hạn, khách hàng sẽ tiếp tục tìm kiếm các giải pháp toàn diện—trung tâm cuộc gọi và BPO—nhưng sẽ chọn các nhà cung cấp có giá thấp hơn hoặc khối lượng lớn hơn nhờ tích hợp AI.
Một chân trời đầy hứa hẹn cuối cùng là chính phủ và dịch vụ công cộng. Một số tác nhân thoại đã xử lý các cuộc gọi không khẩn cấp đến 911; mở rộng công nghệ này cho các cuộc gọi khẩn cấp, giao dịch DMV và các giao diện chính phủ có thể biến đổi trải nghiệm ngày nay vốn gây thất vọng cho cả người dân lẫn nhân viên.
Bức tranh toàn cảnh: ba trụ cột của cuộc cách mạng
Ba sự thay đổi này—biến mất ô nhập liệu, tối ưu hóa cho tác nhân thay vì con người, và khả năng mở rộng của các tác nhân thoại—không phải là những phát triển riêng lẻ. Chúng đại diện cho bước chuyển cuối cùng từ một mô hình AI hỗ trợ con người sang một mô hình AI hoạt động độc lập, chỉ cần giám sát trong những thời điểm quan trọng. Quy mô của kim tự tháp cơ hội thị trường mở rộng gấp 30 lần, từ chi tiêu phần mềm truyền thống sang tổng chi tiêu cho lực lượng lao động. Và khi công nghệ trưởng thành, chi phí sẽ giảm, các mô hình sẽ cải thiện, và các nhà cung cấp dịch vụ biết cách đổi mới sẽ có thể cung cấp năng lực chưa từng có với mức giá cạnh tranh. Thời đại của các tác nhân không phải là ngày mai; nó đã bắt đầu rồi.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Từ "prompt" sang "tự chủ": ba sự biến đổi sẽ định hình lại ngành công nghiệp AI vào năm 2026
Trong hội thảo “Big Ideas for 2026” do Andreessen Horowitz tổ chức, các nhà đầu tư mạo hiểm hàng đầu đã vẽ ra một tầm nhìn đột phá về tương lai: trí tuệ nhân tạo sẽ không còn là một công cụ thụ động chờ lệnh nữa, mà trở thành một tác nhân tự chủ có khả năng dự đoán nhu cầu và hoạt động độc lập. Ba sự thay đổi căn bản sẽ đánh dấu bước chuyển này, với những tác động vượt xa lĩnh vực kỹ thuật.
Giao diện sẽ biến mất: khi các tác nhân thay thế lệnh
Marc Andrusko, đối tác của nhóm đầu tư ứng dụng AI tại a16z, đưa ra một luận điểm gây tranh cãi: đến năm 2026, ô nhập liệu sẽ không còn là trung tâm của tương tác giữa con người và máy móc nữa. Các ứng dụng thế hệ mới sẽ không còn yêu cầu người dùng cung cấp hướng dẫn rõ ràng nữa, mà sẽ quan sát hành vi của họ, chủ động can thiệp và đề xuất các kế hoạch hành động để người dùng phê duyệt.
Phía sau sự thay đổi về mô hình này là một bước nhảy lượng tử trong giá trị tiềm năng của AI. Andrusko nhận thấy rằng thị trường các tác nhân không cần cạnh tranh trong khoản chi tiêu phần mềm toàn cầu hàng năm 300-400 tỷ đô la, mà trong khối lượng của kim tự tháp chi tiêu cho lực lượng lao động: chỉ riêng tại Hoa Kỳ, con số này là 13 nghìn tỷ đô la. Điều này đồng nghĩa với việc mở rộng cơ hội thị trường khoảng 30 lần.
Để hiểu mô hình lý tưởng, Andrusko lấy ví dụ về một loại nhân viên con người. Những người ít chủ động hơn sẽ xác định vấn đề và yêu cầu hướng dẫn. Những người ở đỉnh của kim tự tháp—cấp S—sẽ xác định vấn đề, chẩn đoán nguyên nhân, nghiên cứu các giải pháp thay thế, thực hiện chúng và chỉ quay lại chủ sở hữu để xin phê duyệt cuối cùng. “Đây,” Andrusko nói, “là tương lai của các ứng dụng AI.” Các mô hình ngôn ngữ lớn (LLM) ngày càng trở nên nhanh hơn, rẻ hơn và tinh vi hơn; người dùng vẫn sẽ yêu cầu một bước xác nhận cuối cùng trong các tình huống rủi ro cao, nhưng các mô hình đã có thể đề xuất các gợi ý thông minh và chỉ cần một cú nhấp chuột để xác nhận.
Các ứng dụng như CRM tích hợp AI bản địa minh họa cho sự chuyển đổi này. Ngày nay, một nhân viên bán hàng mở hệ thống và tự quyết định các hành động cần thực hiện. Ngày mai, tác nhân AI sẽ liên tục quét các cơ hội, xem xét hai năm email để tìm lại các khách hàng tiềm năng bị bỏ quên, đề xuất các bước theo dõi kịp thời và tổ chức lịch trình. Nhập liệu của con người sẽ trở thành một ngoại lệ, chứ không phải quy luật.
Thiết kế cho máy móc, không phải cho con người: machine legibility là trung tâm
Stephanie Zhang, đối tác tăng trưởng của a16z, giới thiệu một nguyên tắc thiết kế đột phá: phần mềm sẽ không còn tối ưu cho mắt người nữa, mà cho khả năng hiểu tự động. Những gì phù hợp cho tiêu thụ của con người có thể không quan trọng đối với các tác nhân, và ngược lại.
Zhang nhắc lại các nguyên tắc cơ bản của báo chí: bắt đầu bằng “5W và 1H” để thu hút sự chú ý của con người, vì độc giả thường bỏ qua các chi tiết nằm sâu trong các trang sau. Tuy nhiên, các tác nhân sẽ đọc từng từ của một bài báo với cùng mức độ nhấn mạnh. Trong nhiều năm, các tổ chức đã tối ưu hóa mọi giao diện để phù hợp với nhấp chuột của con người và các bảng điều khiển trực quan. Với sự trỗi dậy của các tác nhân, hệ thống phân cấp thị giác sẽ mất đi trọng lượng trước machine legibility—tiêu chuẩn mới của tối ưu hóa.
Ngay cả ngày nay, các kỹ sư về độ tin cậy hệ thống không còn lật trang các bảng điều khiển Grafana nữa; các SRE AI nhận dữ liệu telemetry, phân tích và báo cáo giả thuyết trực tiếp trên Slack. Các nhóm bán hàng không còn duyệt CRM thủ công nữa; các tác nhân tổng hợp dữ liệu và tóm tắt lại để con người dễ đọc hơn. Thiết kế trực quan, vốn là ưu tiên hàng đầu, sẽ nhường chỗ.
Câu hỏi then chốt vẫn còn bỏ ngỏ: các tác nhân đang tìm kiếm điều gì? Chúng ta vẫn chưa chắc chắn. Nhưng Zhang dự đoán một rủi ro rõ ràng: vì chi phí sản xuất nội dung gần như bằng không và các tổ chức sẽ cạnh tranh để thu hút sự chú ý của các tác nhân, sẽ xuất hiện các khối lượng nội dung siêu cá nhân hóa và tần suất cao, một dạng “nhồi nhét từ khóa của thời đại tác nhân”. Hiện tượng này sẽ thay đổi cách chúng ta tạo nội dung và các công cụ chúng ta sử dụng.
Từ khoa học viễn tưởng đến thị trường thực tế: bùng nổ các tác nhân thoại
Olivia Moore, đối tác của nhóm đầu tư ứng dụng AI tại a16z, ghi nhận một hiện tượng đã diễn ra: các tác nhân thoại đang chuyển từ trình diễn kỹ thuật sang phân phối doanh nghiệp quy mô lớn. Các công ty thực tế, trong gần như mọi ngành, đang thử nghiệm và triển khai hệ thống voice AI.
Ngành y tế là lĩnh vực năng động nhất. Các tác nhân thoại quản lý các cuộc gọi đến các công ty bảo hiểm, nhà thuốc, nhà cung cấp và thậm chí tương tác trực tiếp với bệnh nhân: từ lập lịch hẹn đến theo dõi sau phẫu thuật, đến các cuộc tư vấn tâm thần ban đầu. Yếu tố thúc đẩy chính? Tỷ lệ thay thế cao và khó tuyển dụng trong ngành. Các tác nhân thoại mang lại độ tin cậy và khả năng mở rộng nơi thiếu hụt nhân lực.
Trong lĩnh vực ngân hàng và dịch vụ tài chính, trực giác lại trái ngược: voice AI vượt trội hơn con người. Trong khi con người thường mắc lỗi tuân thủ quy định, các tác nhân thoại tuân thủ chính xác các quy tắc, và mọi tương tác đều có thể theo dõi được. Ưu điểm về tuân thủ quy định này thay đổi cảnh quan cạnh tranh.
Trong tuyển dụng, từ các vị trí cấp thấp trong bán lẻ đến các vai trò tư vấn trung cấp, voice AI cung cấp cho ứng viên các cuộc phỏng vấn bất cứ lúc nào, rồi đưa họ vào quy trình tuyển chọn của con người. Ngành BPO và trung tâm cuộc gọi sẽ trải qua một quá trình chuyển đổi. Một số sẽ giảm dần, số khác sẽ sụp đổ nhanh hơn. Như một câu ngạn ngữ trong ngành nói: “AI sẽ không lấy đi công việc của bạn; người dùng AI mới là người mất việc.” Trong ngắn hạn, khách hàng sẽ tiếp tục tìm kiếm các giải pháp toàn diện—trung tâm cuộc gọi và BPO—nhưng sẽ chọn các nhà cung cấp có giá thấp hơn hoặc khối lượng lớn hơn nhờ tích hợp AI.
Một chân trời đầy hứa hẹn cuối cùng là chính phủ và dịch vụ công cộng. Một số tác nhân thoại đã xử lý các cuộc gọi không khẩn cấp đến 911; mở rộng công nghệ này cho các cuộc gọi khẩn cấp, giao dịch DMV và các giao diện chính phủ có thể biến đổi trải nghiệm ngày nay vốn gây thất vọng cho cả người dân lẫn nhân viên.
Bức tranh toàn cảnh: ba trụ cột của cuộc cách mạng
Ba sự thay đổi này—biến mất ô nhập liệu, tối ưu hóa cho tác nhân thay vì con người, và khả năng mở rộng của các tác nhân thoại—không phải là những phát triển riêng lẻ. Chúng đại diện cho bước chuyển cuối cùng từ một mô hình AI hỗ trợ con người sang một mô hình AI hoạt động độc lập, chỉ cần giám sát trong những thời điểm quan trọng. Quy mô của kim tự tháp cơ hội thị trường mở rộng gấp 30 lần, từ chi tiêu phần mềm truyền thống sang tổng chi tiêu cho lực lượng lao động. Và khi công nghệ trưởng thành, chi phí sẽ giảm, các mô hình sẽ cải thiện, và các nhà cung cấp dịch vụ biết cách đổi mới sẽ có thể cung cấp năng lực chưa từng có với mức giá cạnh tranh. Thời đại của các tác nhân không phải là ngày mai; nó đã bắt đầu rồi.