谷歌正式发布Gemini 3 Pro,多项基准测试表现突出,马斯克奥特曼点赞
11月19日凌晨,谷歌正式发布Gemini 3 Pro预览版,该模型在LMArena排行榜以1501 Elo登顶,在MathArena Apex测试中取得23.4%成绩,展现顶尖数学能力。
Gemini 3 Pro的屏幕理解能力达到72.7%,这意味着AI能够像人类一样"看懂"电脑界面并操作软件。在"人类最后考试"中获37.5%分数,展现出博士级推理能力。多模态理解方面,MMMU-Pro得分81%,Video-MMMU达87.6%。
测试显示,Gemini 3 Pro能够:
· 将手写多语言菜谱转化为可分享的电子版
· 分析运动视频并生成个性化训练计划
· 30秒内生成可运行的3D太空游戏
· 将学术论文转化为交互式学习卡片
OpenAI CEO 山姆奥特曼在X平台发文祝贺:"恭喜谷歌成功推出Gemini 3!看起来是个很棒的模型。"马斯克也转发相关推文称赞"干得不错"。
谷歌同步推出AI开发平台Antigravity,集成Gemini 3和专门控制浏览器的Gemini 2.5 Computer Use模型。该平台支持多个AI智能体并行工作,自主完成编码、测试、验证全流程。
技术细节显示,Gemini 3 Pro使用谷歌自研TPU训练,支持100万token上下文窗口。其深度思考模式在GPQA Diamond测试中达到93.8%,预计未来几周向Ultra订阅用户开放。