Ba bước chuyển đổi quan trọng sẽ định hình lại ngành công nghiệp AI vào năm 2026: từ giao diện văn bản đến các tác nhân tự động, đến cuộc cách mạng về giọng nói

Trí tuệ nhân tạo đang trải qua một giai đoạn chuyển đổi quan trọng. Không còn đơn thuần là những cải tiến gia tăng nhỏ lẻ, mà là một sự thiết lập lại toàn diện cách chúng ta tương tác với các hệ thống thông minh. Trong hội thảo gần đây “Big Ideas for 2026” của Andreessen Horowitz, các đối tác của quỹ đã phác thảo cách các đại lý AI đang chuyển từ công cụ phản ứng sang các nhân viên kỹ thuật số thực thụ, có khả năng hoạt động độc lập.

Sự biến mất của giao diện văn bản như điểm khởi đầu

Thay đổi đột phá đầu tiên liên quan đến việc loại bỏ ô nhập liệu như một yếu tố trung tâm của các ứng dụng AI. Theo dự báo của nhóm a16z, đến năm 2026 người dùng sẽ không còn cần phải đưa ra các prompt phức tạp để đạt được kết quả. Các thế hệ ứng dụng tiếp theo sẽ âm thầm quan sát hành vi của chúng ta, chủ động đề xuất các hành động đã được chuẩn bị sẵn, chỉ cần phê duyệt cuối cùng.

Đằng sau sự thay đổi này là một cơ hội thị trường chưa từng có. Trong khi phần mềm truyền thống hoạt động trong một thị trường trị giá 300-400 tỷ đô la mỗi năm, các đại lý AI đang mở ra một khoản chi tiêu 13 nghìn tỷ đô la dành cho lực lượng lao động tại Hoa Kỳ—một sự mở rộng thị trường khoảng 30 lần. Điều này có nghĩa AI không còn cạnh tranh chỉ trong một phần của ngân sách CNTT, mà tranh giành toàn bộ ngân sách dành cho nguồn nhân lực.

Sự tiến bộ này dựa trên một logic đơn giản: những nhân viên xuất sắc nhất không chờ lệnh, tự nhận diện vấn đề, chẩn đoán nguyên nhân, đề xuất giải pháp và chỉ yêu cầu phê duyệt khi kết thúc quá trình. Các đại lý AI sẽ phải mô phỏng chính xác hành vi này. Trong bối cảnh các hệ thống CRM, ví dụ, một đại lý thông minh không chờ đợi người bán hàng tìm kiếm khách hàng tiềm năng, mà sẽ tự quét các cơ hội đang hoạt động, các cuộc trò chuyện email cũ, và đề xuất các khách hàng tiềm năng đáng nhớ nhất.

Thiết kế phần mềm không còn dành cho mắt người nữa

Cuộc cách mạng thứ hai liên quan đến khái niệm “agent-first” design, hoàn toàn đảo lộn các nguyên tắc đã dựa trên trong nhiều thập kỷ để tạo ra phần mềm. Cho đến nay, mọi giao diện đều tối ưu cho sự chú ý của con người: thông tin quan trọng ở các đoạn đầu, chi tiết trực quan được tổ chức hợp lý, luồng thao tác dễ hiểu để nhấp chuột. Tất cả đều nhằm thu hút ánh nhìn và dễ dàng điều hướng thủ công.

Với sự phát triển của các đại lý AI như trung gian, mô hình này trở nên lỗi thời. Các đại lý không cần các giao diện hấp dẫn về mặt thị giác; họ tìm kiếm thứ gì đó hoàn toàn khác biệt: khả năng máy đọc hiểu, tức là sự rõ ràng về cấu trúc cho phép hệ thống xử lý thông tin chính xác và nhanh chóng. Một đại lý AI sẽ đọc toàn bộ nội dung của một bài báo, trong khi con người chỉ đọc các đoạn đầu. Việc tối ưu hóa không còn liên quan đến thiết kế đồ họa nữa, mà là cấu trúc nền của thông tin.

Điều này dẫn đến hậu quả lan rộng: các nhóm cung cấp dữ liệu, nhà sáng tạo nội dung, nhà phát triển phần mềm đều sẽ phải thiết kế lại các đầu ra của họ cho máy móc, chứ không phải cho con người. Ngay hôm nay, chúng ta đã thấy các kỹ sư tham khảo các báo cáo AI phân tích dữ liệu telemetry và tổng hợp các insight trực tiếp trên Slack, thay vì truy cập thủ công các dashboard giám sát. Các nhóm bán hàng nhận dữ liệu đã được xử lý bởi các đại lý đã phân tích CRM, thay vì phải tự duyệt các nền tảng.

Một hậu quả đáng lo ngại của sự chuyển đổi này có thể là sự xuất hiện của nội dung siêu cá nhân hóa và được sản xuất hàng loạt, đặc biệt để phù hợp với các thuật toán quét của các đại lý, trong một dạng “nhồi nhét từ khóa của thời đại AI”. Không còn là tạo ra các bài viết có tính liên quan và sâu sắc nữa, mà là sản xuất khối lượng lớn nội dung chất lượng thấp được tối ưu hóa theo những gì người ta nghĩ các đại lý muốn “xem”.

Các đại lý thoại: từ khoa học viễn tưởng đến thực tiễn công nghiệp

Sự biến đổi thứ ba là sự trỗi dậy của các đại lý thoại, đã đạt bước nhảy chất lượng quyết định vào năm 2025. Chúng không còn là các thử nghiệm trong phòng thí nghiệm nữa, mà là các hệ thống thực tế mà các doanh nghiệp mua và phân phối quy mô lớn với tốc độ đáng kinh ngạc.

Trong lĩnh vực y tế, các đại lý thoại đang được sử dụng phổ biến: từ các cuộc gọi tới bệnh nhân để theo dõi hậu phẫu, nhắc nhở cuộc hẹn, đến các cuộc phỏng vấn tâm thần ban đầu. Việc áp dụng được thúc đẩy bởi áp lực thực tế—tỷ lệ thay thế nhân viên và khó khăn trong tuyển dụng trong ngành y khiến các giải pháp này không còn là lựa chọn, mà là một yêu cầu vận hành bắt buộc.

Trong lĩnh vực tài chính và ngân hàng, kịch bản còn thú vị hơn. Người ta có thể nghĩ rằng quy định chặt chẽ và luật pháp sẽ cản trở công nghệ thoại hoạt động, nhưng thực tế lại ngược lại. Các đại lý thoại tuân thủ các quy định chính xác 100%, trong khi con người—dù đã được huấn luyện tốt—cũng phạm luật. Thêm vào đó, mỗi tương tác thoại đều để lại dấu vết kỹ thuật số có thể xác minh, giúp việc giám sát hiệu suất và tuân thủ trở nên hoàn toàn minh bạch.

Trong tuyển dụng, các đại lý thoại cho phép ứng viên tham gia phỏng vấn sơ bộ bất cứ lúc nào, 24/7, rút ngắn đáng kể thời gian tuyển chọn cho các vị trí cấp thấp và kỹ thuật.

Những tác động đối với thị trường lao động và dịch vụ

Sự hội tụ của ba xu hướng này sẽ ảnh hưởng sâu rộng đến các trung tâm cuộc gọi và dịch vụ BPO. Nhiều lĩnh vực trong số này sẽ trải qua quá trình chuyển đổi dần dần, số khác sẽ giảm nhanh hơn, tùy thuộc vào cách họ thích nghi với mô hình kinh doanh của mình. Nguyên tắc đơn giản là: “AI không lấy đi công việc của bạn, nhưng người sử dụng AI thì có thể.” Các nhà cung cấp biết tích hợp công nghệ thoại để cung cấp giá cạnh tranh hoặc khả năng quản lý lớn hơn sẽ có lợi thế vượt trội.

Trong ngắn hạn đến trung hạn, một số khách hàng sẽ tiếp tục sử dụng dịch vụ thuê ngoài truyền thống, nhưng sẽ chọn các nhà cung cấp đã áp dụng hệ thống AI để giảm chi phí hoặc tăng khối lượng. Khi các mô hình cơ bản tiếp tục cải thiện và chi phí giảm, các trung tâm cuộc gọi ở nhiều khu vực trên thế giới sẽ phải đối mặt với áp lực ngày càng lớn hơn.

Một lĩnh vực đầy hứa hẹn nhưng còn chưa phát triển nhiều là ứng dụng của các đại lý thoại trong dịch vụ công. Các nền tảng đã xử lý cuộc gọi không khẩn cấp đến 911 có thể dễ dàng mở rộng sang các liên lạc với DMV và các dịch vụ công khác, giảm thiểu sự thất vọng của cả người dân lẫn nhân viên công vụ.

Trong phân khúc tiêu dùng, tốc độ tăng trưởng cho đến nay khá chậm (hầu hết các trường hợp sử dụng là B2B, nơi lợi tức đầu tư rõ ràng), nhưng đang nổi lên một phân khúc thú vị: các trợ lý thoại trong các trung tâm chăm sóc và nhà dưỡng lão, được sử dụng như bạn đồng hành cho cư dân và như các công cụ theo dõi sức khỏe theo thời gian.

Một góc nhìn công nghiệp về giọng nói AI

Điều quan trọng là xem các đại lý thoại không chỉ như một thị trường riêng lẻ, mà như một toàn bộ ngành công nghiệp với cơ hội ở mọi cấp độ của chuỗi cung ứng: từ các mô hình cơ bản đến các nền tảng phát triển, đến các ứng dụng cuối cùng. Điều này có nghĩa là hệ sinh thái sẽ có không gian cho nhiều đối tác, mỗi người đảm nhận vai trò riêng biệt.

Những tiến bộ mới nhất trong các mô hình cơ bản đã mang lại những cải thiện rõ rệt về độ chính xác và độ trễ. Trong một số trường hợp, các công ty còn đang chậm lại một cách có chủ đích thời gian phản hồi của các đại lý thoại, hoặc thêm vào các tiếng ồn nền nhẹ để làm cho chúng trông “con người” hơn và ít giả tạo hơn.

Khả năng của các đại lý thoại xử lý các cuộc trò chuyện đa ngôn ngữ với các giọng mạnh là một lợi thế cạnh tranh nữa, giúp các doanh nghiệp toàn cầu hoạt động mà không bị giới hạn về địa lý như lực lượng lao động con người.

Ba chuyển đổi này—loại bỏ giao diện văn bản, thiết kế theo hướng agent-first, và sự trỗi dậy của các hệ thống thoại công nghiệp—không chỉ là dự đoán, mà còn là những dấu hiệu rõ ràng của một sự thay đổi cấu trúc đã và đang diễn ra. Ai hiểu và dự đoán được những chuyển đổi này sẽ có cơ hội định hình lại toàn bộ các ngành.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim