OpenAI王炸登场！GPT-5.4解锁原生电脑操控，AI直接玩转Excel/金

OpenAI王炸登场！GPT-5.4解锁原生电脑操控，AI直接玩转Excel/金融分析，专业能力超人类OpenAI又一次刷新AI天花板！继GPT-5.3 Instant发布仅一天，美东时间3月5日，全新旗舰模型GPT-5.4重磅来袭，同步登陆ChatGPT、API及Codex开发工具。这款被定义为“迄今能力最强、最高效的专业工作前沿模型”的新作，首次在通用模型中内置原生电脑操控功能，能像人类一样控鼠标、操软件、逛网页，还能深度整合Excel、金融分析工具，职业能力直接对标甚至超越专业人士，更凭借全新工具搜索机制大幅降本，AI从“对话工具”彻底进化为自动化数字打工人，企业办公和专业知识工作的革命，真的来了！颠覆性突破！AI首次解锁原生电脑操控，桌面导航能力超人类GPT-5.4最炸裂的升级，当属OpenAI首次为通用模型赋予原生级电脑操控能力，彻底打破AI只能“动口不动手”的边界！通过API和Codex，GPT-5.4能像人类操作者一样，直接控制鼠标、键盘，灵活操作各类电脑软件、浏览网页，跨应用完成多步骤复杂工作流，还能深度嵌入微软Excel、谷歌表格等企业核心生产力工具。它既可以通过Playwright等库编写代码实现精准操控，也能仅凭截图就做出精准的键鼠指令，开发者还能自定义确认策略，适配不同风险场景的需求，真正做到“所见即能操作”。实测数据更是惊艳：在桌面导航基准测试OSWorld-Verified中，GPT-5.4成功率飙至75.0%，不仅较前代GPT-5.2的47.3%实现翻倍式跃升，更直接超越**人类平均72.4%**的基准水平；浏览器操控、网页截图操作测试中，成功率也分别达67.3%、92.8%，地产科技公司实测中，其房产税门户操作首次成功率95%、三次内100%，速度还比旧模型快3倍！专业能力拉满！44类职业对标专家，金融/法律/编程全精通GPT-5.4的核心定位是专业工作场景的终极助手，在各类职业能力测试中，成绩全面碾压前代，甚至直接站上专业人士水准。在覆盖美国GDP前9大行业、44个职业的GDPval知识工作测试中，GPT-5.4在83.0%的任务中达到或超越行业专家水平，完胜GPT-5.2的71.0%，从销售演示、会计表格到制造业图表、紧急护理排班，各类真实工作产出都能高质量完成；网络搜索能力上，BrowseComp测试中GPT-5.4较GPT-5.2提升17个百分点，Pro版本更是以89.3%的成绩创下该测试历史最高分。金融领域更是迎来专属福利，同步发布的OpenAI金融服务套件，让ChatGPT直接嵌入Excel/谷歌表格单元格，能一键构建、分析、更新复杂财务模型，还整合了FactSet、穆迪等顶级数据资源，覆盖盈利预览、DCF估值、投资备忘录撰写等高频工作，内部投行基准测试得分从GPT-5的43.7%飙升至88.0%，Excel建模测试得分87.3%，远超GPT-5.2的68.4%，投资公司实测其财务和Excel准确率直接提升30个百分点！法律、编程领域同样表现亮眼：法律AI平台测试中得分91%，能精准分析复杂结构化交易、跨长篇合同保持高准确性；SWE-Bench Pro编程测试中与GPT-5.3-Codex持平甚至更优，还能实现1.5倍的生成速度提升，被GitHub评价为“企业第一天就该采用的模型”。更难得的是，GPT-5.4是OpenAI迄今事实准确性最高的模型，单项陈述错误率较GPT-5.2降低33%，完整回应错误概率降低18%，彻底摆脱AI“胡编乱造”的痛点，专业场景放心用！效率革命！工具搜索机制砍半Token消耗，100万Token超大上下文除了能力升级，GPT-5.4还解决了AI落地企业的核心痛点——成本与效率。全新引入的工具搜索机制，彻底重构了工具调用逻辑：此前模型需预加载全部工具定义，动辄消耗数万Token，而新机制下仅需接收轻量化工具列表，按需检索完整定义，在MCP Atlas基准测试的250项任务中，保持准确率不变的同时，总Token用量直接减少47%，地产科技公司实测中更是实现70%的Token消耗降幅，大幅降低企业使用成本。同时，GPT-5.4还解锁了OpenAI迄今最大的100万Token上下文窗口，API端最大输出12.8万Token，能轻松处理跨步骤、长链路的复杂任务，从整体规划到落地执行再到结果验证，全程无需拆分，大幅提升工作效率，Zapier实测后评价其为“迄今为止最具持续性的模型”。双版本分层布局！覆盖个人到高端企业，定价微涨但效率抵成本本次GPT-5.4推出两大版本，精准覆盖不同用户的专业需求，分层布局堪称精准：- GPT-5.4 Thinking：主打复杂深度推理，面向广大付费个人及中小企业，覆盖通用专业场景，即日起登陆ChatGPT Plus、Team及Pro用户，取代原GPT-5.2 Thinking；- GPT-5.4 Pro：追求性能上限，专为高端企业、超复杂任务打造，仅限ChatGPT Pro（月费200美元）及企业计划用户使用，是专业机构的核心生产力工具。免费用户也能在系统自动路由时有限体验GPT-5.4，企业和教育用户还可提前开启权限，而原GPT-5.2 Thinking将在2026年6月5日正式退役，AI升级浪潮全面来袭。定价方面，GPT-5.4较GPT-5.2略有上调，API端核心定价为：GPT-5.4输入2.5美元/百万Token、输出15美元/百万Token；GPT-5.4 Pro输入30美元/百万Token、输出180美元/百万Token，批量处理享半价，优先处理按两倍计费，单次输入超27.2万Token的部分按两倍费率收取。对此OpenAI表示，提价源于核心技术的重大突破和复杂任务能力的大幅提升，而更高效的推理机制能减少实际Token消耗，效率提升足以抵消单价上涨的影响，且其定价仍低于同等能力的竞品前沿模型，性价比依旧在线。AI时代的终极答案？从对话工具到数字代理，专业工作迎来大变革从只能生成文本、代码，到能直接操控电脑、完成全流程专业工作，GPT-5.4的推出，标志着OpenAI的AI模型正式从“智能对话工具”，进化为能自动化执行任务的数字代理系统，深度渗透企业生产力软件和各类专业知识工作场景。当AI能自己操Excel、做金融估值、写法律文书、编复杂代码，甚至比人类更高效、更准确，未来的专业工作者，不再是单纯的执行者，而是成为AI的指挥者和决策者，职场的工作模式、能力要求都将迎来重构。而OpenAI的这步棋，不仅再次巩固了其在大模型领域的领先地位，更让整个行业看到了AI落地实体经济、赋能专业工作的终极可能——AI不是取代人类，而是让人类从繁琐的重复性工作中解放，聚焦更有价值的创意、策略和决策。GPT-5.4的登场，只是AI颠覆专业工作的开始，未来还会有多少惊喜？我们拭目以待！关注我，第一时间解锁GPT-5.4最新使用技巧、行业应用案例，紧跟AI时代的每一次变革，不被时代抛下！

群发资讯网

OpenAI王炸登场！GPT-5.4解锁原生电脑操控，AI直接玩转Excel/金

热门分类