DeepSeek V4 cuối cùng đã ra mắt!


So sánh một chút
Hiện là mô hình mã nguồn mở mạnh nhất hiện nay
Trong lĩnh vực mã, toán học, văn bản dài, Agent đạt hàng đầu thế giới, một số chỉ số vượt qua GPT-4o, Claude Opus 4.6.

一、版本与定位

- V4-Pro: flagship, đối trọng GPT-4o/Opus 4.6, mã nguồn mở mạnh nhất.
- V4-Flash: nhẹ, tốc độ cao, hiệu suất chi phí cao.
- Cấu trúc: MoE 1.6T tham số, mỗi lần kích hoạt khoảng 370B; ngữ cảnh 1 triệu token.
- Công suất: toàn bộ Huawei Ascend 950PR, thay thế Nvidia.

二、核心性能对比(权威评测)

1️⃣ 编程(最强项)

- HumanEval:90%(>Opus 4.5 88%、>GPT-4 82%)。
- SWE-Bench:>80%, khả năng kỹ thuật phần mềm thực tế dẫn đầu.
- Kết luận: AI lập trình viên mạnh nhất thế giới.

2️⃣ 数学/推理

- MATH/STEM:vượt qua tất cả mô hình mã nguồn mở, cạnh tranh GPT-4o/Opus 4.6.
- Khả năng Agent: Agentic Coding đạt đỉnh mã nguồn mở, vượt Claude Sonnet 4.5, gần Opus 4.6 (không phải chế độ suy nghĩ).

3️⃣ 长文本

- Ngữ cảnh: 1 triệu token (≈700 nghìn chữ Trung Quốc), top 3 thế giới (chỉ sau Gemini 3.1).
- Thực tế: phân tích tiểu thuyết/ toàn bộ thư viện 1 triệu chữ không bị sập, mô hình nội địa mạnh nhất về văn bản dài.

4️⃣ 世界知识

- Dẫn đầu tất cả mô hình mã nguồn mở, thấp hơn chút so với Gemini 3.1 Pro.

三、综合排行(2026.4.24)

- Đội hàng đầu đóng nguồn:
1. Gemini 3.1 Pro(mạnh nhất về suy luận/văn bản dài)
2. Claude Opus 4.6(đa năng cân bằng)
3. GPT-4o(hệ sinh thái mạnh nhất)
4. DeepSeek V4-Pro( mã nguồn mở về mã/ văn bản dài hàng đầu, nội địa số 1)
- Đội hàng đầu mở nguồn:
- DeepSeek V4-Pro(chắc chắn số 1, dẫn đầu toàn diện Llama 3/Qwen 3)

四、关键优势

- ✅ Mạnh nhất về mã: vượt GPT-4o/Claude, khả năng nhiệm vụ kỹ thuật.
- ✅ Ngữ cảnh 1 triệu: xử lý văn bản dài hàng đầu thế giới.
- ✅ Công suất nội địa: Ascend toàn bộ, chi phí chỉ bằng 1/70 GPT-4.
- ✅ Mã nguồn mở có thể thương mại: V4-Pro/Flash mở nguồn, giấy phép MIT.

五、短板

- Khả năng tổng thể hơi kém hơn Gemini 3.1/Opus 4.6 (đặc biệt là suy luận sâu).
- Khả năng đa chế độ (hình ảnh và văn bản) yếu hơn GPT-4o/Gemini.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim