群发资讯网

OpenAI王炸登场!GPT-5.4解锁原生电脑操控,AI直接玩转Excel/金

OpenAI王炸登场!GPT-5.4解锁原生电脑操控,AI直接玩转Excel/金融分析,专业能力超人类OpenAI又一次刷新AI天花板!继GPT-5.3 Instant发布仅一天,美东时间3月5日,全新旗舰模型GPT-5.4重磅来袭,同步登陆ChatGPT、API及Codex开发工具。这款被定义为“迄今能力最强、最高效的专业工作前沿模型”的新作,首次在通用模型中内置原生电脑操控功能,能像人类一样控鼠标、操软件、逛网页,还能深度整合Excel、金融分析工具,职业能力直接对标甚至超越专业人士,更凭借全新工具搜索机制大幅降本,AI从“对话工具”彻底进化为自动化数字打工人,企业办公和专业知识工作的革命,真的来了!颠覆性突破!AI首次解锁原生电脑操控,桌面导航能力超人类GPT-5.4最炸裂的升级,当属OpenAI首次为通用模型赋予原生级电脑操控能力,彻底打破AI只能“动口不动手”的边界!通过API和Codex,GPT-5.4能像人类操作者一样,直接控制鼠标、键盘,灵活操作各类电脑软件、浏览网页,跨应用完成多步骤复杂工作流,还能深度嵌入微软Excel、谷歌表格等企业核心生产力工具。它既可以通过Playwright等库编写代码实现精准操控,也能仅凭截图就做出精准的键鼠指令,开发者还能自定义确认策略,适配不同风险场景的需求,真正做到“所见即能操作”。实测数据更是惊艳:在桌面导航基准测试OSWorld-Verified中,GPT-5.4成功率飙至75.0%,不仅较前代GPT-5.2的47.3%实现翻倍式跃升,更直接超越**人类平均72.4%**的基准水平;浏览器操控、网页截图操作测试中,成功率也分别达67.3%、92.8%,地产科技公司实测中,其房产税门户操作首次成功率95%、三次内100%,速度还比旧模型快3倍!专业能力拉满!44类职业对标专家,金融/法律/编程全精通GPT-5.4的核心定位是专业工作场景的终极助手,在各类职业能力测试中,成绩全面碾压前代,甚至直接站上专业人士水准。在覆盖美国GDP前9大行业、44个职业的GDPval知识工作测试中,GPT-5.4在83.0%的任务中达到或超越行业专家水平,完胜GPT-5.2的71.0%,从销售演示、会计表格到制造业图表、紧急护理排班,各类真实工作产出都能高质量完成;网络搜索能力上,BrowseComp测试中GPT-5.4较GPT-5.2提升17个百分点,Pro版本更是以89.3%的成绩创下该测试历史最高分。金融领域更是迎来专属福利,同步发布的OpenAI金融服务套件,让ChatGPT直接嵌入Excel/谷歌表格单元格,能一键构建、分析、更新复杂财务模型,还整合了FactSet、穆迪等顶级数据资源,覆盖盈利预览、DCF估值、投资备忘录撰写等高频工作,内部投行基准测试得分从GPT-5的43.7%飙升至88.0%,Excel建模测试得分87.3%,远超GPT-5.2的68.4%,投资公司实测其财务和Excel准确率直接提升30个百分点!法律、编程领域同样表现亮眼:法律AI平台测试中得分91%,能精准分析复杂结构化交易、跨长篇合同保持高准确性;SWE-Bench Pro编程测试中与GPT-5.3-Codex持平甚至更优,还能实现1.5倍的生成速度提升,被GitHub评价为“企业第一天就该采用的模型”。更难得的是,GPT-5.4是OpenAI迄今事实准确性最高的模型,单项陈述错误率较GPT-5.2降低33%,完整回应错误概率降低18%,彻底摆脱AI“胡编乱造”的痛点,专业场景放心用!效率革命!工具搜索机制砍半Token消耗,100万Token超大上下文除了能力升级,GPT-5.4还解决了AI落地企业的核心痛点——成本与效率。全新引入的工具搜索机制,彻底重构了工具调用逻辑:此前模型需预加载全部工具定义,动辄消耗数万Token,而新机制下仅需接收轻量化工具列表,按需检索完整定义,在MCP Atlas基准测试的250项任务中,保持准确率不变的同时,总Token用量直接减少47%,地产科技公司实测中更是实现70%的Token消耗降幅,大幅降低企业使用成本。同时,GPT-5.4还解锁了OpenAI迄今最大的100万Token上下文窗口,API端最大输出12.8万Token,能轻松处理跨步骤、长链路的复杂任务,从整体规划到落地执行再到结果验证,全程无需拆分,大幅提升工作效率,Zapier实测后评价其为“迄今为止最具持续性的模型”。双版本分层布局!覆盖个人到高端企业,定价微涨但效率抵成本本次GPT-5.4推出两大版本,精准覆盖不同用户的专业需求,分层布局堪称精准:- GPT-5.4 Thinking:主打复杂深度推理,面向广大付费个人及中小企业,覆盖通用专业场景,即日起登陆ChatGPT Plus、Team及Pro用户,取代原GPT-5.2 Thinking;- GPT-5.4 Pro:追求性能上限,专为高端企业、超复杂任务打造,仅限ChatGPT Pro(月费200美元)及企业计划用户使用,是专业机构的核心生产力工具。免费用户也能在系统自动路由时有限体验GPT-5.4,企业和教育用户还可提前开启权限,而原GPT-5.2 Thinking将在2026年6月5日正式退役,AI升级浪潮全面来袭。定价方面,GPT-5.4较GPT-5.2略有上调,API端核心定价为:GPT-5.4输入2.5美元/百万Token、输出15美元/百万Token;GPT-5.4 Pro输入30美元/百万Token、输出180美元/百万Token,批量处理享半价,优先处理按两倍计费,单次输入超27.2万Token的部分按两倍费率收取。对此OpenAI表示,提价源于核心技术的重大突破和复杂任务能力的大幅提升,而更高效的推理机制能减少实际Token消耗,效率提升足以抵消单价上涨的影响,且其定价仍低于同等能力的竞品前沿模型,性价比依旧在线。AI时代的终极答案?从对话工具到数字代理,专业工作迎来大变革从只能生成文本、代码,到能直接操控电脑、完成全流程专业工作,GPT-5.4的推出,标志着OpenAI的AI模型正式从“智能对话工具”,进化为能自动化执行任务的数字代理系统,深度渗透企业生产力软件和各类专业知识工作场景。当AI能自己操Excel、做金融估值、写法律文书、编复杂代码,甚至比人类更高效、更准确,未来的专业工作者,不再是单纯的执行者,而是成为AI的指挥者和决策者,职场的工作模式、能力要求都将迎来重构。而OpenAI的这步棋,不仅再次巩固了其在大模型领域的领先地位,更让整个行业看到了AI落地实体经济、赋能专业工作的终极可能——AI不是取代人类,而是让人类从繁琐的重复性工作中解放,聚焦更有价值的创意、策略和决策。GPT-5.4的登场,只是AI颠覆专业工作的开始,未来还会有多少惊喜?我们拭目以待!关注我,第一时间解锁GPT-5.4最新使用技巧、行业应用案例,紧跟AI时代的每一次变革,不被时代抛下!