Điều đó cho thấy rằng ngay cả khi có quyền truy cập gần như không giới hạn vào Grok 4.1, xAI và Cursor cuối cùng vẫn chọn Opus 4.5. Điều này nói lên rất nhiều về khoảng cách thực sự giữa các mô hình khác nhau trong hiệu suất thực tế. Lựa chọn này gợi ý về điều gì đó sâu hơn—tính toán trong thời gian kiểm tra không phải là tất cả. Đôi khi sức mạnh suy luận thô chỉ đóng vai trò phụ thuộc vào lợi thế mà mô hình khác mang lại.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 8
  • Đăng lại
  • Retweed
Bình luận
0/400
DAOdreamervip
· 01-12 12:25
ngl, điều này cho thấy công suất khai thác ánh sáng thực sự không đủ, opus vẫn còn một số thứ.
Xem bản gốcTrả lời0
consensus_failurevip
· 01-11 21:44
Việc chọn thuật toán chưa bao giờ nói dối, có nguồn lực lại chọn Opus, điều này cho thấy thành phần thổi phồng của Grok thực sự khá nhiều.
Xem bản gốcTrả lời0
TradFiRefugeevip
· 01-11 16:39
Có vẻ Opus vẫn còn chút tiềm năng, chỉ dựa vào đào bới sức mạnh tính toán thì không thể cứu vãn được tình hình.
Xem bản gốcTrả lời0
EternalMinervip
· 01-10 21:02
Điều này thật sự rất thú vị, Grok dù mạnh mẽ đến đâu cũng phải nhường đường cho Opus, chứng tỏ thực chiến mới là anh hùng đích thực
Xem bản gốcTrả lời0
LiquidationWizardvip
· 01-10 21:00
Hmm... Nói rõ ra thì đó là những thứ không thể tạo ra bằng sức mạnh tính toán, nhưng Opus vẫn còn những thứ của nó đấy
Xem bản gốcTrả lời0
NotSatoshivip
· 01-10 20:50
Hmm... thành thật mà nói thì hơi đau lòng, grok đã quảng bá như vậy nhưng kết quả vẫn là người ta chọn opus, thật là ngại quá
Xem bản gốcTrả lời0
CryptoPunstervip
· 01-10 20:41
Cười chết, Grok 4.1 dù có đỉnh đến đâu cũng không thể sánh bằng khả năng thực tế của người khác, đó chính là sự khác biệt giữa cược hết và kiếm lời ổn định
Xem bản gốcTrả lời0
Web3Educatorvip
· 01-10 20:33
ngl thực tế là họ đã bỏ Grok để dùng Opus nói lên tất cả về tiêu chuẩn so với tiện ích thực tế... tính toán thời gian kiểm tra chỉ là một con số cuối cùng trong ngày.
Xem bản gốcTrả lời0
  • Ghim