DeepSeek đã ra mắt V3.2 Exp với kiến trúc DeepSeek Sparse Attention (DSA) mới của họ, tuyên bố rằng nó giảm thiểu tác động của việc mở rộng theo cấp số nhân của tính toán với độ dài ngữ cảnh. Chúng tôi đã độc lập đánh giá V3.2 Exp đạt được trí thông minh tương tự như DeepSeek V3.1 Terminus; DeepSeek đã chuyển sang sử dụng V3.2 cho điểm cuối API chính của họ và đã giảm giá API hơn 50%. Với giá API của DeepSeek được cập nhật, chi phí để chạy Chỉ số Trí thông minh Phân tích Nhân tạo giảm từ 114 đô la xuống 41 đô la. DeepSeek tuyên bố đã "cố ý điều chỉnh" các cấu hình đào tạo của V3.1 Terminus và V3.2 Exp. Việc khớp với hiệu suất của V3.1 Terminus dường như chứng minh rằng các lợi ích về hiệu suất của kiến trúc DeepSeek Sparse Attention không đi kèm với chi phí cho trí thông minh. Những điểm chính từ việc đánh giá: ➤🧠  Không thay đổi về trí thông minh tổng thể: Trong chế độ lý luận, DeepSeek V3.2 Exp đạt 57 trên Chỉ số Trí thông minh Phân tích Nhân tạo. Chúng tôi coi điều này tương đương về trí thông minh với DeepSeek V3.1 Terminus (Lý luận) ➤📈 Không suy giảm trong lý luận ngữ cảnh dài: Mặc dù có sự thay đổi trong kiến trúc của DeepSeek, V3.2 Exp (Lý luận) dường như không có sự suy giảm nào trong lý luận ngữ cảnh dài - đạt được một chút tăng nhẹ trong AA-LCR. ➤⚡ Hiệu suất không lý luận: Trong chế độ không lý luận, DeepSeek V3.2 Exp không cho thấy sự suy giảm về trí thông minh, khớp với DeepSeek V3.1 Terminus với điểm số 46 trên Chỉ số Trí thông minh Phân tích Nhân tạo. ➤⚙️ Hiệu quả token: Đối với DeepSeek V3.2 Exp (Lý luận), việc sử dụng token để chạy Chỉ số Trí thông minh Phân tích Nhân tạo giảm nhẹ từ 67M xuống 62M so với V3.1 Terminus. Việc sử dụng token không thay đổi đối với biến thể không lý luận. ➤💲Giá cả: DeepSeek đã giảm đáng kể giá mỗi token cho API bên thứ nhất của họ từ 0.56 đô la/1.68 đô la xuống 0.28 đô la/0.42 đô la cho 1 triệu token đầu vào/đầu ra - giảm 50% và 75% giá cả của token đầu vào và đầu ra tương ứng. Các chi tiết khác về mô hình: ➤©️ Giấy phép: DeepSeek V3.2 Exp có sẵn theo Giấy phép MIT. ➤🌐 Sự sẵn có: DeepSeek V3.2 Exp có sẵn qua API DeepSeek, đã thay thế DeepSeek V3.1 Terminus. Người dùng vẫn có thể truy cập DeepSeek V3.1 Terminus qua một API DeepSeek tạm thời cho đến ngày 15 tháng 10. ➤📏 Kích thước: DeepSeek V3.2 Exp có 671B tham số tổng cộng và 37B tham số hoạt động. Đây là cùng kích thước với tất cả các mô hình trước đó trong loạt DeepSeek V3 và R1.
So sánh cách mà DeepSeek V3.2 Exp hoạt động so với các mô hình bạn đang sử dụng hoặc đang xem xét tại:
41,33K