6月8日,新京报组织6款主流AI大模型,参与2026年新高考I卷数学试题测评,并邀请多位资深数学教师负责阅卷评判。本次测试总分150分,科大讯飞讯飞星火拿到148分,排名第一,成绩领先于Kimi、DeepSeek、智谱、MiniMax、ChatGPT等模型。在答题表现上,讯飞星火并非仅保证答案正确,答题过程规范严谨,推理逻辑完整清晰,规范得分与结果得分完全持平,没有因步骤疏漏丢失分数。压轴题是检验大模型复杂推理能力的分水岭,不少模型面对多步骤、高逻辑难度的压轴题,出现思路衔接不畅、推导乏力等问题。北京市中学数学特技教师点评,压轴题成为区分模型复杂推理能力的分水岭,“讯飞星火在数形结合、对图形几何性质的研究上明显优于其他模型。”面对几何题型,它能够精准挖掘图形内在特征,依托几何性质简化运算步骤,解题思路简洁凝练。如部分试题中,它既可以运用常规解法作答,还能同时给出几何法、向量法两种解题思路;在相关小题里,灵活借助三角形面积关系、夹角公式推进解题,巧妙降低运算难度。反观其他模型,有的偏向机械代数推导,不擅长结合图形分析,有的解法繁琐、思路单一。综合来看,讯飞星火在数学综合解题,尤其是几何逻辑运用上,展现出极强的硬实力。
#人工智能国家队##大模型国家队##全栈自主可控#
