DeepSeek-V3.2正式版发布:开源模型能力推向极致
🚀 重磅发布
DeepSeek-V3.2正式版今日发布,推理能力比肩GPT-5,Speciale版本斩获奥数金牌,开源模型能力推向极致!
核心亮点
1. 双版本齐发:DeepSeek-V3.2平衡推理与效率,适合日常使用;V3.2-Speciale专注极致推理,探索能力边界
2. 性能突破:在公开推理基准测试中达到GPT-5水平,仅略低于Gemini-3.0-Pro
3. 竞赛佳绩:Speciale版本斩获IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025四项国际金牌
4. 技术创新:首次实现思考模式与工具调用的融合,支持1800+环境、85000+复杂指令的强化学习训练
技术革新
DeepSeek-V3.2引入DeepSeek Sparse Attention(DSA)稀疏注意力机制,通过128维FP8精度闪电索引器,将注意力成本降低近9倍,实现长文本训练和推理效率的大幅提升。
同时,模型支持思考模式与非思考模式的自由切换,在智能体评测中达到当前开源模型最高水平,大幅缩小了与闭源模型的差距。
开源与定价
DeepSeek-V3.2已在Hugging Face和ModelScope平台全面开源,官方API价格同步下调超50%:
输入价格:缓存命中0.2元/百万tokens,缓存未命中2元/百万tokens
输出价格:降至3元/百万tokens
