群发资讯网

DeepSeek新模型曝光 开源圈又出大动作,新模型核心是671B参数量的MoE

DeepSeek新模型曝光 开源圈又出大动作,新模型核心是671B参数量的MoE架构,有意思的是激活参数仅370亿,既兼顾了大模型的性能下限,又能压算力消耗。实测能对标不少闭源商业模型,长上下文和推理表现亮眼,解决了之前开源模型要么性能不够要么部署难的老问题,算是实打实的技术迭代。DeepSeekDeepSeek开源模型