Theo Mars Finance, phiên bản web của DeepSeek đã ra mắt "Chế độ Nhận diện Hình ảnh", hỗ trợ tải lên hình ảnh để hiểu và phân tích, nhưng chưa được phát hành rộng rãi. Hôm nay, Chen Xiaokang đã đăng bài trên X kèm hình ảnh, ngụ ý mở rộng hơn nữa chế độ đa mô hình. Trước đó đã ra mắt "Chế độ Nhanh" và "Chế độ Chuyên gia". Cổng truy cập "vision" đồn đoán phù hợp cao với chế độ mới, các chuyên gia cho rằng tương tác hình ảnh và văn bản sẽ mở rộng hệ sinh thái sản phẩm, gần với các mô hình lớn như GPT-4o, Gemini.

MarsBitNews

2026-04-29 08:56:05

Đang tạo bản tóm tắt

Thông tin từ Mars Finance ngày 29 tháng 4, một số người dùng phản hồi rằng phiên bản web của DeepSeek đã ra mắt “Chế độ nhận diện hình ảnh”. Khi thử nghiệm, phát hiện chế độ này hỗ trợ người dùng tải lên hình ảnh và thực hiện hiểu và phân tích nội dung. Hiện tại, chức năng này vẫn chưa được triển khai toàn diện, giới hạn chức năng cụ thể vẫn chưa rõ ràng. Đáng chú ý là, ngay trong ngày hôm nay, nhà nghiên cứu phụ trách phát triển đa mô thức của DeepSeek là Trần Tiểu Kháng đã đăng bài trên nền tảng X với nội dung “Now, we see you” kèm hình ảnh, trong đó biểu tượng “Cá voi” đặc trưng của DeepSeek đã tháo bỏ mắt kính. Vào đầu tháng này, DeepSeek mới ra mắt “Chế độ nhanh” và “Chế độ chuyên gia”, trong đó chế độ trước phù hợp cho đối thoại hàng ngày, phản hồi tức thì; chế độ sau phù hợp cho các vấn đề phức tạp, cần chờ đợi vào giờ cao điểm. Lúc đó đã có ảnh chụp màn hình lan truyền cho thấy, ngoài “Chế độ nhanh” và “Chế độ chuyên gia”, DeepSeek còn có một chế độ gọi là “vision”. Chế độ “nhận diện hình ảnh” mới nhất rất phù hợp với cửa vào “vision” đã truyền thông trước đó. Phân tích cho rằng, việc mở rộng khả năng đa mô thức của DeepSeek đồng nghĩa với việc hệ sản phẩm của nó từ đối thoại thuần văn bản chính thức mở rộng sang tương tác hình ảnh và văn bản, hướng tới các mô hình đa mô thức chính thống như GPT-4o, Gemini. (Quan sát toàn cảnh)

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

Phần thưởng
Thích
Bình luận
Đăng lại
Retweed

Bình luận

Thêm một bình luận

Không có bình luận

Chủ đề thịnh hành
Xem thêm
#
WCTCTradingKingPK
368.53K Phổ biến
#
CryptoMarketsDipSlightly
269.53K Phổ biến
#
IsraelStrikesIranBTCPlunges
36.04K Phổ biến
#
#DailyPolymarketHotspot
699.79K Phổ biến
#
StrategyAccumulates2xMiningRate
139.47M Phổ biến

Ghim

sơ đồ trang web

DeepSeek thử nghiệm chế độ "nhận diện hình ảnh", khả năng đa phương thức chính thức mở cửa｜độc quyền

Chủ đề thịnh hành

WCTCTradingKingPK

CryptoMarketsDipSlightly

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

StrategyAccumulates2xMiningRate

Ghim