Vào sáng ngày 24 tháng 3 năm 2026, tôi đang ngồi trong khán phòng của Ngày Demo của YC W26 batch, khi nghe đến phần trình bày của công ty thứ năm, tôi quyết định không còn ghi chú nữa.

Không phải là không quan trọng, mà là tôi nhận ra rằng những gì tôi ghi lại có thể đã lỗi thời sau tháng tới.

Trong đợt này, hơn một trăm công ty, công việc họ làm thực ra rất tập trung cao độ: khoảng 80% là agent dọc, ví dụ như giúp luật sư sắp xếp tài liệu, giúp bộ phận chăm sóc khách hàng phân phát phiếu công tác, giúp HR sàng lọc hồ sơ.

Nếu nhìn thấy những dự án này vào tháng 10 năm ngoái, tôi có khả năng sẽ nghĩ “rất có ý tưởng”. Nhưng vấn đề là, trong năm tháng qua, thế giới đã thay đổi.

Claude Code từ một công cụ hướng về nhà phát triển, đã trở thành giao diện gần như ai cũng có thể dùng trực tiếp. Sau khi Opus 4.6 ra mắt, toàn bộ vibe coding đã bị đẩy xuống mức sàn.

Những agent dọc đó, trước khi hình thành rào cản kinh doanh, ngày nay một kỹ sư bình thường, thậm chí chính tôi, chỉ cần một cuối tuần là có thể làm ra chúng, họ đã mất đi giá trị đầu tư.

Chu kỳ dự án của YC là ba tháng, đợt này bắt đầu vào tháng 12, cộng với giai đoạn sơ tuyển, tức là “công ty tốt” được chọn từ 5 tháng trước. Trong bối cảnh tốc độ AI hiện nay, 5 tháng đủ để xảy ra vài vòng chuyển đổi mô hình.

Năm 2012, lần đầu tôi khởi nghiệp, nhận được lời mời phỏng vấn trực tiếp của YC, khi đó YC gần như là một trong những đơn vị dẫn đầu trong lĩnh vực tăng tốc, các công ty được chọn thường đại diện cho “hướng đi tiếp theo”. Nhưng bối cảnh cạnh tranh đang thay đổi, những năm gần đây YC dường như đã trở thành một chỉ số trễ (lagging indicator).

Hệ thống batch của YC, từ nộp đơn, sơ tuyển, nhập trại, hoàn thiện, trình diễn, đã vận hành hơn mười năm trong thời đại internet di động, rất thành công. Nhưng nhịp này được thiết kế cho một thế giới chậm hơn.

Quay lại ngành đầu tư mạo hiểm trong năm rưỡi qua, tôi khoảng mỗi quý lại đến Silicon Valley một lần, lần gần nhất là tháng 10 năm ngoái. Trước đây, mỗi lần đến, tôi đều cảm thấy thay đổi rất nhanh, nhưng phần lớn cảm giác “nhanh” này là theo tháng.

Lần này, phải theo “tuần”.

Có một ngày tối, trong bữa tối, một người bạn làm post-training (đào tạo sau) tình cờ nói:

“Tôi phát hiện, chính Silicon Valley còn bắt kịp chính mình nữa rồi.”

Toàn bộ token-maxxing: Một cuộc chạy đua vũ trang không ai dám dừng lại

Nửa năm trước, nếu ai đó nói với tôi rằng, Meta có hàng chục nghìn kỹ sư, tất cả đều dùng sản phẩm của đối thủ để viết mã, tôi sẽ nghĩ đó là đùa.

Nhưng điều đó là thật. Toàn bộ Meta, tất cả đều đang dùng Claude Code. Đây không phải là startup, không phải là nhóm thử nghiệm, mà là một công ty trị giá nghìn tỷ đô la.

Mã an toàn không còn nữa, ngân sách token bị bắn phá, bảng xếp hạng tranh đua dữ dội, toàn Silicon Valley đang đổ tiền vào AI không tiếc tay. Nhưng sau khi đổ rồi thì sao?

Nói về an toàn mã. Nửa năm trước, chuyện này hoàn toàn không thể tưởng tượng nổi, vì mã là tài sản cốt lõi của công ty, làm sao để cho API của một công ty khác chạm vào? Ban đầu, Meta cũng nghĩ như vậy, họ đã làm một thứ gọi là myclaw để giải quyết vấn đề này. Một người bạn của Meta nói với tôi, họ đã tạo ra sản phẩm coding, nhưng “không dùng được, không ai dùng”. Không ai dùng, công ty buộc phải nới lỏng: chỉ cần không liên quan đến dữ liệu khách hàng, thích dùng Claude Code thì dùng.

Sau đó các phòng ban bắt đầu họp nội bộ kiểu “làm thế nào để trở thành tổ chức AI native”, tổ chức đào tạo, làm thi đua. An toàn mã, an toàn sử dụng, những giới hạn thiêng liêng ngày xưa, đều bị đẩy ra phía sau, trước mắt là đẩy nhanh hiệu quả.

Vì lý do an toàn, Google cấm hầu hết nhân viên dùng Claude Code hoặc Codex của đối thủ, nhưng DeepMind là ngoại lệ, các nhóm phụ trách mô hình Gemini và ứng dụng nội bộ đều dùng Claude Code.

Google cũng không phải không cố gắng: họ đã ra mắt công cụ mã hóa nội bộ Antigravity, tháng 2 năm nay còn tuyên bố khoảng 50% mã mới của công ty đã do AI viết.

Nhưng dù sao, người của DeepMind vẫn dùng Claude Code. Một lý do quan trọng là Anthropic đã cung cấp cho họ triển khai riêng tư, vì Anthropic đã có nền tảng tin cậy dựa trên việc inference và huấn luyện của họ chủ yếu chạy trên TPU của Google Cloud. Nhưng các ông lớn công nghệ khác như Meta thì không có mối quan hệ này, họ thật sự bỏ an toàn mã sang một bên. Tất cả đều cược vào một điều: đẩy nhanh tốc độ.

An toàn mã chỉ là lá cờ đầu tiên đổ xuống, mặt thứ hai là ngân sách token.

Trong vài công ty startup AI-native ở Palo Alto, ngân sách token của một kỹ sư trong một năm khoảng hơn 20 nghìn USD. Con số này không lạ, điều lạ là chi phí AI của một kỹ sư hàng đầu đã gần bằng lương của họ. Có vẻ như công ty đang dùng AI để cắt giảm nhân sự, nhưng tổng chi phí thực ra không giảm, chỉ là đổi từ chi phí nhân lực sang chi phí token.

Meta lại cực đoan hơn nữa. Họ đã lập ra bảng xếp hạng tiêu thụ token nội bộ: ai dùng nhiều nhất sẽ lên bảng, cuối bảng có thể bị sa thải, thậm chí nhân viên Meta còn tranh đua để có danh hiệu “token legend” không chính thức.

Nhưng đồng thời, Meta trong năm nay đã sa thải liên tiếp hai đợt, quy mô tổng cộng hàng nghìn người. Một mặt, toàn bộ nhân viên dùng Claude Code để đẩy lượng token, mặt khác lại cắt giảm quy mô nhân sự lớn.

Hai chuyện này không mâu thuẫn, chúng là hai mặt của cùng một vấn đề.

Tôi đã xem một công ty C round, trưởng nhóm kỹ thuật mở Slack cho tôi xem, toàn agent đang chạy, hàng chục Cursor agent chạy song song, rồi mở một cửa sổ Claude Code để điều phối. Hiện tại, các lập trình viên đang rất lo lắng: nếu trước khi đi ngủ mà không biết mấy agent của mình sẽ làm gì, thì rất hoang mang.

Nhưng năng suất thực sự đã tăng gấp bao nhiêu? Từ cuối năm ngoái, nhiều CTO của các công ty hàng đầu về inference, database, rất phấn khích nói với tôi: “Nhân viên gấp trăm lần”, “Hiệu quả tăng mười lần”, trước đây 60 người làm trong một năm, giờ chỉ cần 2 người cộng với Claude Code là trong một tuần có thể làm xong.

Ban đầu tôi cũng vui theo họ, nhưng sau đó tôi bình tĩnh lại, và đặt ra một câu hỏi: Ừ, hiệu quả tăng 100 lần, thì doanh thu của công ty có tăng 100 lần không? Hay là mở rộng dòng sản phẩm 100 lần? Chắc chắn không thể chỉ nâng cao “100 lần” rồi cuối cùng cắt giảm bao nhiêu người?

Tôi không nhận được câu trả lời rõ ràng. Thực tế, hiệu quả 100 lần chỉ thể hiện khoảng 50% hoặc gấp đôi doanh thu của công ty.

Chênh lệch nằm ở đâu? Hiện tại vẫn chưa ai rõ.

“Dùng nhiều token như vậy, công ty chắc chắn phải biến đổi gene thành một dạng khác rồi. Nhưng biến thành gì, tôi cũng không biết.”

Có một người sáng lập xuất thân từ bán hàng B2B nói với tôi, nhóm của anh ấy 16 người, trong đó có hai người bán hàng, trong 12 tháng đã đạt 30 triệu USD ARR, tất cả đều dựa vào coding AI. Những ví dụ này thực ra thỉnh thoảng vẫn thấy, nhưng phần lớn là các startup tạo ra nhiều thứ hơn, nhưng những thứ đó vẫn chưa phù hợp với thị trường (PMF).

Hiện tại, Silicon Valley rất chuộng thử 100 cách làm bằng vibe coding, xem cách nào khả thi, chứ không chỉ thử 10 cách. Nhưng ai có thể nắm bắt xu hướng phát triển tiếp theo? Cũng còn rất khó nói.

Một ví dụ phản biện sâu sắc nhất đến từ Anthropic. Tôi hỏi một người bạn của Anthropic, trong nội bộ họ, cảnh tượng đau đớn nhất khi dùng agent là gì? Anh ấy nói là oncall (phản ứng tức thời).

Một nhiệm vụ oncall điển hình là: nếu API của Claude đột nhiên phản hồi chậm, một nút mô hình bị treo, hoặc người dùng phản hồi prompt xuất ra lỗi, kỹ sư oncall cần nhanh chóng xác định nguyên nhân, xem là do bug mã, vấn đề phân bổ tính toán hay bất thường của mô hình, rồi quyết định sửa thế nào.

Anthropic là công ty mạnh nhất thế giới về Coding agent, cảnh này gần như là cốt lõi năng lực của họ, vậy mà internal oncall agent của họ vẫn chưa tốt.

Đây là trạng thái thực tế của tháng 4 năm 2026: máy hơi nước đã được phát minh, nhưng đôi khi còn chạy chậm hơn xe ngựa. Chìa khóa là mọi người đều biết máy hơi nước cuối cùng sẽ chạy nhanh hơn, nên đang đổ tiền điên cuồng: bỏ qua an toàn mã, ngân sách token bùng nổ, bảng xếp hạng tranh đua dữ dội. Nhưng khi nào máy hơi nước thực sự vượt qua xe ngựa? Không ai biết, nhưng không ai dám dừng lại chờ đợi ngày đó.

Vì dừng lại có thể còn tốn hơn cả đốt token sai.

Hơn nữa, lượng tiêu thụ token có khả năng không tăng tuyến tính. Điều này khiến tôi nhớ lại trải nghiệm lái xe tự động của mình trước đây: năm 2021, chúng tôi ở Thượng Hải, lần đầu tiên thực hiện thành công lái tự động liên tục 5 giờ không cần can thiệp. Lúc đó, nghĩ đó là bước đột phá lớn, trước đó, đội xe thử nghiệm chỉ có 10, 15, 20 chiếc từ từ tăng lên; nhưng sau điểm đó, nhanh chóng lên tới 100, 1000 chiếc. Hiện tại, các agent coding đang ở giai đoạn tương tự.

Năm 2021 tại Thượng Hải, Didi tự lái lần đầu tiên đạt liên tục 5 giờ không can thiệp, là một cột mốc của tự động hóa trong nước. Ảnh là ông Meng Xing, COO của Didi tự lái, đối thoại với Sebastian Thrun, “cha đẻ xe tự lái” của Google, năm 2021.

METR là tổ chức nghiên cứu chuyên đánh giá năng lực mã hóa AI của California. Họ năm ngoái đề xuất một chỉ số: đo lường khả năng của agent AI hoàn thành nhiệm vụ với tỷ lệ thành công 50% (tính theo thời gian hoàn thành của chuyên gia con người). Tháng 3 năm 2025, khi ra mắt Claude 3.7 Sonnet, chỉ số này là 50 phút; đến cuối năm 2025, Claude Opus 4.6 đã đạt 14.5 giờ. Trong hai năm qua, chu kỳ nhân đôi của chỉ số này đã rút ngắn từ 7 tháng xuống còn 4 tháng. Một khi độ tin cậy của agent tiến một bước nữa, tiêu thụ token không còn là vấn đề tăng 50% mỗi năm nữa, mà là tăng một cấp độ trong một đêm.

Có một dự đoán được nhiều người đồng thuận là, đến cuối năm nay, nhiều công ty (bao gồm các tập đoàn công nghệ lớn) thực ra chỉ cần 20% nhân lực.

Đội ngũ xAI sụp đổ, những người chế tạo tên lửa bắt đầu chế tạo mô hình

Trong một nhà hàng steak ở Mountain View, vào hơn 9 giờ tối, một người bạn từng làm việc lâu năm cùng Elon Musk ngồi đối diện tôi. Trò chuyện hơn ba giờ, tôi nhận ra, trong suốt quá trình đó, anh ấy dường như chưa từng nói lời nào khen Elon Musk.

Một chi tiết: tôi hỏi anh ấy, trong 3 năm làm xAI, nhịp sống hàng ngày thế nào? Anh ấy nói suốt ba năm gần như sống trong công ty, nên nhà không mấy trang trí, thậm chí chưa mua giường. Trong công ty, anh ấy ngủ trong sleeping pod (khoang ngủ), giống như nhà trọ sinh viên. Tôi bảo, giờ anh đã có cổ phần khủng, đã nghỉ việc rồi, ít nhất cũng mua nổi giường chứ. Anh ấy cười.

Công việc của xAI nổi tiếng là khắc nghiệt ở Silicon Valley, nhưng giờ đội ngũ ban đầu đã rời đi khoảng 90%. Họ có một nhóm rời việc, ngày nào cũng thêm người mới.

Nguyên nhân bắt đầu từ việc Tony Wu bị sa thải, rồi phản ứng dây chuyền, theo lời một người trong nội bộ, “Các công ty khác cần nửa năm để chuẩn bị đội ngũ quản lý rời đi, còn xAI chỉ cần một tháng”. Một số người đã cảm nhận được sự không hài lòng của Elon Musk từ tháng 10 năm ngoái, nhưng không ngờ lại thanh lý toàn bộ nhanh như vậy.

Hiện tại, Elon Musk bắt đầu điều động người từ SpaceX và Tesla sang tiếp quản xAI, “những người chế tạo tên lửa bắt đầu chế tạo mô hình”.

Sự không hài lòng của Musk xuất phát từ việc ông đã bỏ ra vô số tiền và sức mạnh tính toán, nhưng Grok mãi chưa thể vào hàng đầu. Tại sao? Đây là câu hỏi mà mọi người trong giới xAI đều hỏi. Câu trả lời thực ra đơn giản hơn tôi nghĩ, một người bạn nói thẳng: “Đội ngũ rất mạnh, làm việc cực kỳ chăm chỉ, nhưng cách quản lý kiểu công nghiệp chế tạo có thể không phù hợp với các công ty mô hình lớn.”

Tôi đã làm tự lái tự động tám năm, có vài cảm nhận riêng về chuyện này. Trước đây, Elon Musk từng làm SpaceX, Tesla, về bản chất là làm hệ thống kỹ thuật: chuỗi dài, liên quan đến phần mềm, phần cứng, chuỗi cung ứng, mỗi phần đều có thể sáng tạo, nhưng cuối cùng là một vấn đề kỹ thuật toàn diện.

Ông ấy giỏi trong việc nhận diện các điểm then chốt trong chuỗi dài đó, rồi rút ngắn thời gian tối đa để giải quyết. Các động cơ tên lửa liên kết, hạ cánh tái sử dụng, đều là kết quả của tư duy này.

Nhưng ở xAI, ông ấy không làm như vậy. Hiện tại, ông ấy làm ba việc: đầu tiên, đổ một hệ thống GPU lớn nhất thế giới (thậm chí giờ mọi người đùa là xAI ban đầu là neo lab, giờ còn giống như neo cloud, cung cấp sức mạnh tính toán cho Cursor), sau đó, đặt ra deadline theo kiểu đột phá, rồi tự mình làm một số đặc điểm sản phẩm. Đây là tập trung vào một vài điểm, chứ không phải lập kế hoạch toàn diện.

Những người làm tự động lái xe đều biết, khi đến giai đoạn cuối, các nhóm phần mềm, hạ tầng, phần cứng, “ai làm chủ” sẽ trở thành mâu thuẫn cốt lõi. Ba hướng này đều cần người cấp CTO để quyết định, nhưng không ai cùng hiểu rõ ba lĩnh vực đó. Cách tốt nhất là, dù sáng lập không hiểu hết, nhưng biết cách cân bằng nguồn lực, xác định ưu tiên theo giai đoạn, giai đoạn này ưu tiên phần mềm, giai đoạn sau giao cho hạ tầng. Đó gọi là có kế hoạch toàn cục.

Vấn đề của xAI là không có kế hoạch toàn cục này, chỉ có chạy đua. Nếu áp lực không quá lớn, những người thông minh thực sự có thể tự sửa chữa, cho họ thời gian, các hướng sẽ tự tìm ra nhịp hợp tác. Nhưng áp lực cực cao của Musk, cộng với thiếu kế hoạch toàn cục, khiến mọi thứ đổ vỡ. Người đứng đầu mỗi hướng đều giữ ưu tiên của riêng mình, không ai làm tổng thể.

Thành công của SpaceX và Tesla một phần là do trong hai ngành này, Musk gần như chưa từng gặp đối thủ cạnh tranh cùng quy mô, ông tự cạnh tranh với chính mình. Nhưng AI thì khác, AI là cuộc cạnh tranh khốc liệt, thậm chí còn có thể bị Anthropic “ăn cắp” khách hàng của chính OpenAI.

Một đồng sáng lập xAI năm ngoái nói rằng ông không ngờ có hai chuyện: thứ nhất là cạnh tranh khốc liệt như vậy, thứ hai là cơ hội đổi mới ứng dụng trong kỷ nguyên AI ít đến mức bị mô hình “ăn mất”.

Sự trỗi dậy của Anthropic là một trong những bước ngoặt kịch tính nhất của ngành AI trong năm qua. Nó cũng thay đổi hoàn toàn chiến trường: một năm trước, mọi người còn đang cạnh tranh về lượng người dùng C端 và tạo video, thì bây giờ (tạm thời) chiến trường quyết định thắng thua là toB và coding.

Dĩ nhiên, câu chuyện của xAI cũng là câu chuyện về “tiền đến quá nhanh, quá nhiều, sẽ ra sao”.

Tôi nghĩ những người rời khỏi xAI hôm nay cũng không hối tiếc vì quyết định tham gia ngày xưa, xAI đúng là huyền thoại giàu có nhanh nhất của Silicon Valley. Từ vòng gọi vốn đầu tiên vài chục tỷ đô, đến hôm nay hợp nhất với SpaceX, trở thành “kỳ lân” trị giá 2500 tỷ USD, chỉ trong vòng một năm. Và 9 đồng sáng lập của xAI, gần như mỗi người đều trở thành tỷ phú, kỹ sư chính có thể có vài chục triệu đến 1 tỷ USD, tiền của Silicon Valley thật sự quá nhiều. Họ nếu tái khởi nghiệp hôm nay, sẽ có đủ tự tin để theo đuổi lĩnh vực mình thích, chứ không chỉ làm những việc kiếm tiền nhanh.

Các kỹ sư lo lắng, các nhà nghiên cứu còn lo hơn

Khi nói chuyện với các kỹ sư, giờ đây có một sự đồng cảm kỳ lạ: ai cũng thừa nhận mình ít viết code hơn, nhưng đều giả vờ như không có gì, vì họ tin rằng AI sẽ trang bị cho họ, và loại bỏ những kỹ sư không dùng AI.

Ngày nay, 80% kỹ năng cốt lõi của phần mềm đã bị mô hình thay thế, lý do còn lại là mô hình đôi khi còn “ngớ ngẩn”, cần người giám sát. Nhưng “giám sát” này có thể sớm cũng không còn cần nữa.

Nghiêm trọng hơn, ý nghĩ “tổ chức AI native” nghe có vẻ hấp dẫn — khiến mỗi phòng ban rà soát quy trình, chuyển phần có thể AI can thiệp thành trực tuyến, viết thành kỹ năng. Nhưng về bản chất, đó là tự làm mỏng chính mình: biến năng lực của mình thành kỹ năng của máy, công ty nắm được kỹ năng của bạn, thực chất đã hoàn thành quá trình AI hóa, rồi có thể sẽ cắt giảm nhân sự dựa trên đó, đó là vấn đề đạo đức. Hiện Meta đang làm chuyện này.

Dù mọi người đều đang tranh đua token-maxxing, nhưng vẫn cảm nhận được một nỗi lo lắng âm ỉ trong toàn Silicon Valley.

Điều tôi không ngờ hơn nữa là, nỗi lo này đang lan rộng sang nhóm nhà nghiên cứu.

Researcher là nhóm nhân tài đỉnh cao nhất, không phải là “nghiên cứu viên” chung chung, mà là nhóm trong các công ty mô hình lớn (OpenAI, Anthropic, DeepMind, v.v.) chịu trách nhiệm huấn luyện mô hình, sáng tạo thuật toán. Họ khác engineer ở chỗ: engineer là “làm ra thứ gì đó”, viết code, triển khai, tối ưu hiệu năng; researcher là “nghĩ ra thứ gì đó để làm”: đề xuất phương pháp huấn luyện mới, thiết kế kiến trúc mô hình, chạy thử nghiệm xác nhận giả thuyết.

Và giờ, ngay cả công việc của researcher cũng đang bị tự động hóa. Đó là việc các đồng nghiệp của DeepMind đang làm — dùng mô hình để huấn luyện mô hình, cũng là xu hướng AI tự tiến hóa đang bùng nổ trong năm nay. Năm nay, những người bị loại là engineer, đến cuối năm, researcher cũng sẽ bắt đầu bị thay thế.

Chuyện này không còn là khái niệm mới nữa. Andrej Karpathy đã mở đầu cho auto research (nghiên cứu tự động), giờ các công cụ AI scientist, framework harness đều đi theo hướng này. Nhưng phần lớn vòng kín hiện tại mới chỉ dừng lại ở “đăng bài báo” — AI giúp chạy thử nghiệm, viết bài, nhưng cuối cùng vẫn do con người đánh giá.

Các công ty như OpenAI, Anthropic, Google muốn làm tiến xa hơn: họ hy vọng vòng kín sẽ trực tiếp nâng cấp mô hình, không chỉ là cải tiến chi tiết, mà còn để AI tự tìm ra bước đột phá mô hình tiếp theo. Nếu làm được chuyện này, thì đúng là đang thay thế researcher. Google DeepMind đã thử nghiệm nội bộ hơn một năm, để mô hình tự quyết định thử nghiệm tiếp theo, tự đánh giá xem con đường nào có triển vọng hơn, rồi theo con đường đó — đó chính là mô hình tự huấn luyện thế hệ tiếp theo của chính nó.

Hơn nữa, researcher còn có lý do để bị sa thải, rất tàn nhẫn — vì họ đắt đỏ. Trong toàn cầu, số researcher chỉ vài nghìn người, lương hàng năm có thể lên đến vài triệu, chục triệu hoặc thậm chí trăm triệu USD.

“Trong tương lai, có thể 10 người làm việc của 100 người, nhận 20% lương, còn 90% người mất việc.”

Và thực tế, cắt giảm nhân sự còn lớn hơn con số bề nổi. Nhiều công ty cắt đầu tiên không phải trên báo cáo tài chính của chính họ, mà là các nhà cung cấp dịch vụ thuê ngoài. Điều này có nghĩa là, các quốc gia như Ấn Độ, Philippines, từng là nơi cung cấp dịch vụ khách hàng, dán nhãn dữ liệu, hậu cần tài chính cho phương Tây, có thể là những nơi bị tác động đầu tiên. “Cầu thang dịch vụ” mà các nước đang dựa vào để nâng cấp kinh tế có thể đang bị AI “xóa sổ”.

Toàn Silicon Valley đang dõi theo Meta, nếu mô hình thử nghiệm thành công — doanh thu không giảm, hiệu quả thực sự tăng — các tập đoàn lớn khác sẽ nhanh chóng bắt theo, cắt giảm nhân sự trở thành chuyện phổ biến trong ngành. Và quá trình cắt giảm này còn có cơ chế tự thúc đẩy: ban đầu, mọi người không dám cắt vì sợ ảnh hưởng tinh thần, nhưng khi đã thành thói quen, thì càng cắt càng nhanh, càng không còn cảm giác tiếc.

Nhưng đồng thời, những vị trí mới cũng đang xuất hiện.

Nhiều startup bắt đầu tuyển dụng một vai trò mới gọi là “AI builder” — kết hợp product manager, kỹ sư front-end, back-end thành một. Cũng có những vị trí ghép giữa data scientist và machine learning engineer, hoặc các vị trí tổng hợp viết nội dung, chạy quảng cáo, vận hành.

Nhu cầu về các vai trò mới này ở Silicon Valley rất lớn, nhưng vấn đề cốt lõi là: không ai biết cách tuyển họ. Không thể dựa vào hồ sơ để chọn, vì vai trò này chưa từng tồn tại, khả năng của người đó có thể nằm trong dự án cá nhân; cũng không thể kiểm tra bằng viết code trực tiếp, vì năng lực cốt lõi là “thẩm mỹ + khả năng dùng AI”. Đã có startup làm chuyện này: dựa theo yêu cầu của nhà tuyển dụng, tự động tạo ra môi trường mô phỏng, để ứng viên dùng AI hoàn thành nhiệm vụ trong chỗ thi. Giống như bài kiểm tra coding ngày xưa, nhưng kiểm tra một thứ hoàn toàn mới.

Khi AI có thể làm mọi thứ, giá trị của con người đang chuyển từ “biết làm gì” sang “đánh giá xem cái gì đáng làm, cái gì không nên làm”.

Hai vòng gọi vốn, mỗi vòng đều định giá cao, Nvidia đang đặt cược lớn vào từng “bàn chơi” của mình

Trước những người bị thay thế kể trên — kỹ sư, researcher, nhà tài chính — nhưng có một vai trò không bị thay thế, thậm chí còn ngày càng trở thành “ông trùm” đằng sau.

Thế giới đổi mới phân tán này, thực ra lại cực kỳ tập trung.

Đó chính là Nvidia.

Tôi từng nghĩ rằng, trong năm qua, sự khan hiếm của chip đã giảm bớt. Thật vậy, có thời điểm, vào giữa 2025, một số neo cloud do Nvidia hỗ trợ, chuyên cung cấp GPU cho làn sóng AI, gặp khó khăn về tài chính, thậm chí có công ty bán mình. Nhưng lần này tôi đến, mới nhận ra, sự khan hiếm đã trở lại, còn dữ dội hơn trước.

Một tín hiệu rõ ràng: nếu bạn có thể cung cấp API ổn định, như API của Claude, đạt mức ổn định 99 phần trăm, bạn có thể bán với giá gấp 2-3 lần giá API chính thức.

Sau khi Anthropic tăng trưởng đột biến, các dịch vụ API bị gián đoạn ngày càng nhiều, gây khó khăn cho nhiều sản phẩm agent dựa trên Claude.

Trước đây, làm Router (dịch vụ định tuyến) là “rẻ hơn chính hãng, có nhiều lượt truy cập”. Giờ đây, hoàn toàn đảo ngược: tính ổn định đã trở thành tài nguyên khan hiếm. Một số startup đã kiếm được rất nhiều tiền từ chuyện này, giờ đây, các “mini” của Coreweave / Nebius ở Silicon Valley mọc lên như nấm sau mưa.

Và lần này, giới hạn về sức mạnh tính toán không chỉ là vấn đề phân bổ GPU. Elad Gil gần đây viết một nhận định tôi rất đồng tình: năng lực mở rộng của các nhà sản xuất bộ nhớ (Hynix, Samsung, Micron) ít nhất còn hai năm nữa mới đủ. Điều này có nghĩa là, trước năm 2028, không một công ty AI nào có thể dựa vào tăng cường sức mạnh tính toán để tạo ra khác biệt rõ rệt. Giới hạn về sức mạnh tính toán đang củng cố vị thế của các ông lớn trong thị trường mô hình lớn — không phải là do họ không cố gắng, mà là do chu kỳ sản xuất vật lý quá chậm.

Cấu trúc quyền lực phía sau rõ ràng: ai có card thì mạnh, ai có card thì do Nvidia quyết định. Hiện tại, các nhà cung cấp như CoreWeave, Lambda, Nebius đều dựa vào Nvidia.

Nvidia đã có chiến lược sâu hơn tôi nghĩ. Các nhà đầu tư của Reflection nói rằng, khi họ bắt đầu huy động vốn, ban đầu là làm coding, rồi sau đó, họ gặp Huang Renxun, ông ấy bảo: “Đừng làm coding nữa, ra ngoài làm ‘DeepSeek của Mỹ’, làm mô hình mã nguồn mở của Mỹ, tôi sẽ cho tiền và card cho cậu.” Reflection đã chuyển hướng hoàn toàn.

Thị trường vốn Mỹ cũng xuất hiện một số cấu trúc chưa từng thấy: trong cùng một vòng gọi vốn, có hai mức định giá khác nhau. Các nhà đầu tư quen thuộc, vào sớm, sẽ đầu tư ở mức thấp; còn các ông lớn như Nvidia, không thiếu tiền, sẽ đẩy vào mức cao hơn. Cấu trúc này mới bắt đầu xuất hiện gần đây ở trong nước.

Nhưng dù Nvidia muốn kiểm soát phân phối, cũng không thể kiểm soát những thứ không tồn tại.

Toàn bộ xã hội Mỹ đang phản đối dữ liệu trung tâm. Hiện có khoảng 100 dự án trung tâm dữ liệu đang gặp khó, trong đó 40 dự án có thể thất bại hoàn toàn. Bang Maine vừa ban hành luật cấm xây dựng trung tâm dữ liệu. Một thị trấn phê duyệt dự án trung tâm dữ liệu trị giá 6 tỷ USD, rồi sau đó, hơn phân nửa thành viên bị bãi nhiệm qua đêm, người mới được bầu lên chỉ để hủy bỏ quyết định đó.

Sức mạnh tính toán không đủ, không phải vì sản phẩm không tốt, không đủ người dùng, mà vì thế giới vật lý không theo kịp “dạ dày” của thế giới số.

Đây là một cấp độ “kém theo kịp” khác.

Hệ thống định giá của Silicon Valley đang được viết lại

Trước tiên, hãy xem một con số.

GDP của Mỹ khoảng 30 nghìn tỷ USD. Hiện tại, doanh thu hàng năm của OpenAI và Anthropic đều khoảng 30 tỷ USD, tức là mỗi công ty đã chiếm khoảng 0.1% GDP Mỹ. Nếu cuối năm nay, hai công ty này đạt 100 tỷ USD doanh thu, cộng thêm các dịch vụ đám mây và các khoản thu khác từ AI, thì AI sẽ chiếm khoảng 1% GDP Mỹ. Từ gần như bằng không đến 1% chỉ trong vài năm.

Tốc độ này chưa từng có. Nhưng kỳ lạ là, tốc độ tăng trưởng càng nhanh, các nhà đầu tư càng không biết định giá thế nào — trước tốc độ tăng trưởng này, khung định giá của Silicon Valley đang sụp đổ.

Tôi đã thảo luận nhiều vòng với một số bạn làm thị trường thứ cấp, và một từ xuất hiện nhiều lần là “re-rationalization” (hồi quy về lý tính của định giá).

Trong vài năm qua, khi đầu tư vào AI, lý luận định giá của mọi người dựa trên dòng tiền tương lai: hôm nay lỗ cũng không sao, tôi cược rằng sau 3 hoặc 5 năm, ARR của cậu sẽ lớn. Nhưng giờ, khung này bắt đầu có vấn đề.

Vấn đề nằm ở mô hình định giá DCF (chiết khấu dòng tiền) cơ bản nhất. Thường thì, dựa trên DCF, ta dự đoán dòng tiền 10 năm tới, rồi cộng thêm giá trị cuối kỳ (terminal value), giả định công ty sẽ vận hành ổn định sau đó, rồi gói gọn phần còn lại. Thường thì, terminal value chiếm 70-80% toàn bộ định giá.

Nhưng giờ, có hai điều cùng thay đổi: thứ nhất, bạn chỉ có thể dự đoán 3 năm chứ không phải 10, vì sau 3 năm (hoặc thậm chí 1 năm), ngành này sẽ ra sao, rất khó đoán; thứ hai, giá trị cuối kỳ không còn tính được nữa, vì giả định là công ty sẽ vận hành ổn định, nhưng nếu AI có thể thay đổi mọi thứ bất cứ lúc nào, thì giả định “ổn định” này không còn đúng nữa.

Tôi ví dụ một người bạn đầu tư thứ cấp, rằng các công ty không nằm trong trục chính của AI ngày nay, giống như đang chờ một “quả bom hạt nhân”, biết chắc sẽ bị phá hủy, chỉ là chưa biết khi nào. Vậy, trọng tâm đánh giá không còn là “nếu bị phá hủy sẽ ra sao”, mà là “khi bị phá hủy, phản ứng của công ty sẽ nhanh thế nào”. Đây là một cách định giá hoàn toàn khác.

SaaS là lĩnh vực đầu tiên bị Wall Street định giá lại. Năm 2023, Snowflake dự tính phải mất gần 100 năm dòng tiền tự do để hòa vốn, nay đã giảm một nửa, ServiceNow, Workday cũng theo xu hướng này, mới chỉ bắt đầu.

Thậm chí, nói ngược lại, những công ty phù hợp để định giá bằng DCF có thể chỉ còn các ông lớn mô hình lớn, vì tương lai của họ có vẻ ổn định, không bị “bắn phá”, mà đang xem xét khả năng mở rộng biên giới.

Trong quá khứ, các startup thường nói: “Lương thấp một chút, nhưng đổi lấy quyền chọn cổ phần, sau này sẽ rất có giá trị”. Nhưng câu chuyện này dựa trên giả định rằng, công ty còn tồn tại và còn giá trị sau 15-20 năm. Nếu giả định đó không còn đúng nữa, phản ứng hợp lý nhất của nhân viên sẽ là — “Đừng cho tôi quyền chọn nữa, trả tiền mặt luôn đi”.

Điều này lại ảnh hưởng đến cấu trúc chi phí và cơ chế huy động vốn của công ty.

Các quỹ đầu tư mạo hiểm cũng đang đau đầu. Trong 3-6 tháng qua, hầu hết các quỹ ở Silicon Valley đều đã đầu tư ít nhất một startup neo lab, những nhà nghiên cứu từ các phòng lab danh tiếng, mang ý tưởng của mình huy động hàng tỷ USD. Nhưng giờ, ai cũng cảm thấy hơi quá đà, hơi đắt. Nhưng tại sao vẫn đầu tư? Bởi vì, nếu startup đó thực sự thành công, tốc độ tăng trưởng sẽ nhanh đến mức khiến bạn nghĩ rằng, mức định giá ban đầu là quá rẻ.

Một nhà đầu tư nói thẳng: “Dù sao, hoặc là từ 0 đến 100, hoặc là từ 0 đến 0, thì cứ đầu tư vào một neo lab có khả năng vô hạn, còn hơn là làm ăn kiểu ‘kiếm tiền vặt’ ở vòng A đắt đỏ.”

Trước đây, mọi người nghĩ rằng 1 đồng doanh thu ARR là 1 đồng, không phân biệt là làm mô hình, ứng dụng hay hạ tầng. Nhưng giờ, phép tính này đã bị phá vỡ.

Các agent dọc có hệ số nhân thấp nhất (khoảng 5 lần), agent tổng quát cao hơn (khoảng 10 lần), còn mô hình lớn nhất (ví dụ Anthropic 30 tỷ USD ARR, định giá 800 tỷ USD, hệ số nhân 26.7). Một năm trước, tôi nghĩ rằng, dựa trên ARR nhân một hệ số chung để tính định giá là hợp lý, nhưng giờ, công thức đó đã hoàn toàn sai.

Orange Tree và danh sách sát thủ AI

Silicon Valley đang trải qua một cuộc khủng hoảng an ninh sâu sắc.

Trong chuyến đi này, tôi nghe đi nghe lại các cuộc thảo luận của bạn bè về một chuyện: mua Bitcoin, xây bunker, lắp kính chống đạn cho nhà, họ đều không đùa.

Gần đây, Silicon Valley rất chuộng trồng cây cam, vì loại cây này có nhánh dài 4 inch, có gai nhọn, ai cố gắng vượt qua đều phải trả giá.

Thậm chí, tờ Wall Street Journal còn đưa tin về một “biệt thự pháo đài” trị giá 15 triệu USD: trong chậu bê tông trồng một vòng cây cam, phía sau là hào sâu, rồi đến hệ thống cảm biến laser, cửa chính là thép đặc dày 3 inch với 13 chốt khóa, trong nhà có phòng trú ẩn an toàn nặng 2000 pound, thậm chí cảnh quan cũng là hàng rào phòng thủ.

Các doanh nghiệp cung cấp dịch vụ an ninh nhà ở cho CEO, đạt mức tăng trưởng cao nhất kể từ 2003. Đặc biệt, sau vụ CEO của UNH bị bắn chết ở Manhattan, xu hướng này càng nhanh hơn.

Rồi, súng còn xuất hiện ngay trước cửa nhà các ông lớn AI.

Vào rạng sáng ngày 11 tháng 4, một chàng trai 20 tuổi mặc áo Champion, từ Texas bay đến California, cầm can xăng, đứng trước cửa nhà Sam Altman trị giá 27 triệu USD, rồi đốt bom xăng, ném vào.

Sau một giờ rưỡi, hắn xuất hiện tại trụ sở OpenAI, lấy ghế đập vỡ cửa kính, hét lên: “Tôi sẽ đốt hết nơi này, giết hết mọi người trong đó.”

FBI đã tìm thấy trong người hắn một tài liệu có tiêu đề “Cảnh báo cuối cùng”. Trong đó ghi rõ tên và địa

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
270.12K Phổ biến
#
比特币Breaks79K
14.55K Phổ biến
#
IsraelStrikesIranBTCPlunges
34.05K Phổ biến
#
CryptoMarketsRiseBroadly
82.27K Phổ biến
#
WHCADinnerShootingIncident
11.57K Phổ biến

Ghim

sơ đồ trang web

Toàn bộ nhân viên tối đa token, một cuộc chạy đua vũ trang không ai dám dừng lại

Chủ đề thịnh hành

WCTCTradingKingPK

比特币Breaks79K

IsraelStrikesIranBTCPlunges

CryptoMarketsRiseBroadly

WHCADinnerShootingIncident

Ghim