群发资讯网

200亿美元收购,只为堵住AI最大漏洞?

英伟达200亿美元买Groq:AI推理芯片“军备竞赛”拐点当全世界都还坚信「谁拥有GPU谁就是AI领域的国王」之时,英伟

英伟达200亿美元买Groq:AI推理芯片“军备竞赛”拐点

当全世界都还坚信「谁拥有GPU谁就是AI领域的国王」之时,英伟达却宣称:我偏要把国王升级成为皇帝,没错,就是那个一下子拿出200亿美元现金,创造了自家并购历史上最高纪录的英伟达。

如果你对AI推理芯片有那么一些了解,都会忍不住询问,GPU原本售卖情况还挺不错的,黄仁勋,为什么要急急忙忙去和Groq合作?更荒唐的是,这个操作听起来就好像苹果忽然宣告「iPhone不生产了,我打算去卖诺基亚板砖」一般,悬念一下子就被拉到了最高。

这事在2025年12月24日清晨被曝光,那时硅谷那边的人还没睡醒,路透社就独家发布了稿件,其中有三个关键词,200亿美元、非独家授权、核心团队全体搬迁。

图 | 英伟达200亿美元收购Groq事件曝光

往回退两周,也就是12月10号,能看到Groq的创始人Jonathan Ross接连三天出入英伟达位于圣克拉拉的总部;到了12月18号,SEC的文件里暗暗显现英伟达新添加了递延现金支出这一项目,数额正好是200亿。

就好像学霸在考试前一天晚上,突然把卷子递给监考老师并说:「答案你拿去,记得给我留一道选择题就行。」简单而言,Groq所拥有的王牌,就是TSP(Tensor Streaming Processor),它可以将计算图分解成时钟级确定性指令流,延迟能够被预估到纳秒级别。

同样运行1750亿参数的GPT时,A100的batch延迟为3.2毫秒,而Groq仅需0.7毫秒,并且功耗还低28%。

图 | A100与Groq技术性能对比

芯片型号

1750亿参数GPT延迟

功耗对比

单价

状态

英伟达A100

3.2毫秒

基准

-

量产

Groq

0.7毫秒

低28%

1.8万美元

量产

谷歌TPUv5e

1.1毫秒

-

-

试验版

Tenstorrent

0.9毫秒

-

3万美元

试验版

难题出现:不管GPU多么强大,排队等显存的老毛病也没办法被改变,金融高频交易、自动驾驶刹车模型,根本就不认可等一下那一套。

国际同行也不是没有举措,谷歌的TPUv5e将延迟缩减到了1.1毫秒,Tenstorrent用RISC-V核追至0.9毫秒,可都还带着试验版的标识,成本还急剧涨到每颗3万美元,而Groq已经实现量产了,单价1.8万美元,谁更实惠一眼便清晰明了。

图 | 英伟达200亿美元收购Groq的交易结构

那问题就产生,英伟达直接买技术送团队,会不会又像当年英特尔花153亿美元,买下Mobileye后出现水土不服的情况?2023年英特尔把Mobileye估值削减到460亿美元重新上市,转手却仅仅收回很少一部分现金,真可以说是"高价买进却落得一场空"。

图 | 科技巨头并购的潜在风险

聪慧倒是挺聪慧的,可是TSP架构和CUDA生态根本就不相关,要将指令集转换成自家的ISA,就好像让北京人突然去学闽南话一样,工期至少要18个月,客户愿不愿意等?

更为实际的情况是,Groq Cloud没有被收购,仍然持续对外提供服务,倘若有朝一日那些被Azure或者AWS培养熟络了的客户,突然改变想法,英伟达难道不就白白为他人费心了吗?

把镜头拉远,英伟达真正的算盘是"训练+推理"通吃。训练端H100毛利率上升到70%,然而护城河正遭到AMD MI300、谷歌TPU的攻击,倘若推理端再失去,就等于是将AI落地最丰厚的那一块肉白白送出去。

图 | TSP架构与CUDA生态整合的技术挑战

购入Groq,就好像把低延迟这一金字招牌揽到怀里,同时也顺带堵住了初创阵营中那最快的超车道,但要说这就一劳永逸,恐怕也未必。ASIC这条赛道如今玩家众多,今天刚拿下Groq,明天还得提防Cerebras、SambaNova,200亿美元顶多算续命的药,可算不上长生不老的灵丹。

现实里检验情况并不能只盯着数字,2022年Groq的营收是1.2亿美元,到了2024年发展成到了4.6亿,差不多快涨了4倍,可还是赔本1.1亿,英伟达一年的净利润超出500亿,它只要4个月的现金流,就能弄出200亿,账面上的压力还可以掌控得住。

图 | Groq 2022-2024年财务数据表现

摆在眼前的是同样可豪赌的赛例,2021年AMD花费350亿并购Xilinx,整合之后数据中心业务的年增速从90%下滑到45%,股价在18个月里处于横盘情况。

重要的差别不在于钱财的事情,而是生态翻译能力的事情,可以把TSP安装到CUDA里头,就好像把F1引擎安装到民航客机里头,到底是飞得更快还是直接散架,那就得看英伟达的"集成本领。

这并非是芯片性能的较量,而是生态绑定的游戏。谁要是能够把纳秒级延迟转化成美元级的现金流,那么谁才是真正的AI军火商。

图 | AI推理芯片的未来趋势

谁要是能够把纳秒级延迟转化成美元级的现金流,那么谁才是真正的AI军火商

实际情况比较残酷,半导体历史上从来没有买买买便能轻松获胜的奇迹,展望方面比较诱人,AI推理战场才刚刚开启,低延迟便属于下一个"摩尔定律"。

留给英伟达的时间窗口不太充足,也就只剩下两年,要是整合开展得很顺利,到2026年融合卡就会面市,推理延迟会再减少十倍,云厂商就只能接着喊黄老板真香,要是整合出现失败的情况,那么那200亿美元就变为了最费钱的人才招聘开销,ASIC群星就会趁机冒出来。

对于吃瓜的读者而言,牢记这样一句话,当大象启动舞动身躯,要么是地动山摇,要么就是将自身摔得骨折,在接下来的两年里,不要错过。

声明:本文内容95%左右为人工手写原创,少部分借助AI辅助,但是所有的内容都是本人经过严格审核和核对的。