2026 年第一天,DeepSeek 就搞了个大动作,上传了《mHC:流形约束超连接》新论文,创始人梁文锋也在合著名单里。这论文提出的 mHC 新架构,是为解决传统超连接在大规模模型训练中的不稳定问题。 自 2016 年残差连接成深度神经网络标配后,超连接增加了并行路径和连接方式,可也削弱了信息“原样传递”能力,模型规模越大问题越明显。mHC 技术很巧妙,用数学方法把连接方式约束在特定空间,恢复信息稳定传递能力。这就像给超连接的“信息通道”制定“交通规则”,让模型训练稳定,也更容易做大,或许能为下一代基础架构演进指明方向。