2026-01-10 20:32:41

Điều đó cho thấy rằng ngay cả khi có quyền truy cập gần như không giới hạn vào Grok 4.1, xAI và Cursor cuối cùng vẫn chọn Opus 4.5. Điều này nói lên rất nhiều về khoảng cách thực sự giữa các mô hình khác nhau trong hiệu suất thực tế. Lựa chọn này gợi ý về điều gì đó sâu hơn—tính toán trong thời gian kiểm tra không phải là tất cả. Đôi khi sức mạnh suy luận thô chỉ đóng vai trò phụ thuộc vào lợi thế mà mô hình khác mang lại.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

14 thích

Phần thưởng
14
8
Đăng lại
Retweed

Bình luận

0/400

DAOdreamer

· 01-12 12:25

ngl, điều này cho thấy công suất khai thác ánh sáng thực sự không đủ, opus vẫn còn một số thứ.

Xem bản gốcTrả lời0

consensus_failure

· 01-11 21:44

Việc chọn thuật toán chưa bao giờ nói dối, có nguồn lực lại chọn Opus, điều này cho thấy thành phần thổi phồng của Grok thực sự khá nhiều.

Xem bản gốcTrả lời0

TradFiRefugee

· 01-11 16:39

Có vẻ Opus vẫn còn chút tiềm năng, chỉ dựa vào đào bới sức mạnh tính toán thì không thể cứu vãn được tình hình.

Xem bản gốcTrả lời0

EternalMiner

· 01-10 21:02

Điều này thật sự rất thú vị, Grok dù mạnh mẽ đến đâu cũng phải nhường đường cho Opus, chứng tỏ thực chiến mới là anh hùng đích thực

Xem bản gốcTrả lời0

LiquidationWizard

· 01-10 21:00

Hmm... Nói rõ ra thì đó là những thứ không thể tạo ra bằng sức mạnh tính toán, nhưng Opus vẫn còn những thứ của nó đấy

Xem bản gốcTrả lời0

NotSatoshi

· 01-10 20:50

Hmm... thành thật mà nói thì hơi đau lòng, grok đã quảng bá như vậy nhưng kết quả vẫn là người ta chọn opus, thật là ngại quá

Xem bản gốcTrả lời0

CryptoPunster

· 01-10 20:41

Cười chết, Grok 4.1 dù có đỉnh đến đâu cũng không thể sánh bằng khả năng thực tế của người khác, đó chính là sự khác biệt giữa cược hết và kiếm lời ổn định

Xem bản gốcTrả lời0

Web3Educator

· 01-10 20:33

ngl thực tế là họ đã bỏ Grok để dùng Opus nói lên tất cả về tiêu chuẩn so với tiện ích thực tế... tính toán thời gian kiểm tra chỉ là một con số cuối cùng trong ngày.

Xem bản gốcTrả lời0