老黄可能开始焦虑了

2026年4月15日，黄仁勋在Dwarkesh Patel的播客里经历了一场他很久没经历过的尖锐追问。一个多小时的对话，他反复用来定义英伟达的那句话是：“必须有东西把电子变成token。”他把自家公司形容成“全球每瓦生产token最多的架构”——不是每瓦算力最多，是每瓦token最多。

这是一家卖GPU的公司，在重新定义自己。

为什么要重新定义？因为他比任何人都更早地看见一件事——AI时代的权力，正在被分成两种不同的东西。一种是算力，在美国手里；另一种是token，在中国手里。这两种权力不在同一个平面上，谁都吃不掉谁。而英伟达夹在中间，它原来以为自己是最大的赢家，现在发现自己是这两个结构里都没有舒服位置的那个。

这才是他焦虑的真正原因。

算力的地主，token 的租客

先看美国那半边。

4月14日，EpochAI发布最新数据——Amazon、Google、Meta、Microsoft、Oracle五家美国hyperscaler合计持有全球67%的AI算力，按H100等价口径折算。2024年Q1这个数字是60%。十八个月里，全球AI算力的集中度又提高了七个百分点，而且上行趋势看不到减速。

这五家公司有一个共同点：它们都不做前沿模型。

Google 算是一个例外，TPU自研加Gemini自己做，但剩下四家的基本身位是“收租的”——Microsoft靠Azure给OpenAI租算力，Amazon靠AWS和自家Trainium芯片把Anthropic绑在身边，Oracle靠Stargate项目切进OpenAI的基础设施版图，Meta自己造芯片但主要内用，4月13日刚与Broadcom签了1GW自研芯片订单。

那谁在用这些算力？前沿 AI lab 都是它们的租客。Anthropic刚宣布扩大与Google的TPU合作，未来几年要接入多GW级算力。OpenAI的骨干算力是Microsoft Azure加Oracle Stargate——OpenAI在2月刚完成1100亿美元融资，Amazon投了500亿，SoftBank投了300亿，Nvidia追加了300亿（从原本承诺的1000亿缩水而来）。xAI自建集群，但芯片仍然从英伟达买。

美国 AI 产业真实的权力结构，是这样的：5家算力地主+ 3家前沿模型租客+一个Nvidia。外界以为OpenAI、Anthropic、xAI是主角，实际上它们是交租的一方。它们每融一轮钱，都要把大头交给那五家地主——这五家地主同时也是它们的投资人、它们的供应商、它们的谈判对手。

Nvidia 在这个结构里，看上去是最大的赢家。它拿了2026财年大约1150亿美元的数据中心收入，市值3万亿美元以上。但这个身位的脆弱性，黄仁勋自己看得最清楚。

他在3月的Morgan Stanley大会上宣布，Nvidia投资OpenAI的300亿美元和投资Anthropic的100亿美元大概率都是最后一笔。两个月前他刚把那100亿美元押给Anthropic，Anthropic转身就加大了TPU合作——Nvidia投资的钱，流回去帮对手做非英伟达的算力。

这是商业层面的选择：Anthropic 不能只依赖一家芯片供应商，它必须分散。Nvidia的客户结构本来就高度集中——全球算力版图上，真正的大户就是那五家美国公司。加上中国市场，那就是它过去两年数据中心业务的全部核心收入池。2025年4月之后，H20禁令让中国这一池水基本蒸发。剩下的五家客户，每一家都比Nvidia更想往上游吃——Meta自研芯片、Amazon有Trainium、Google有TPU、Microsoft和Oracle在押OpenAI的自研Titan。

一个卖铲子的人，面对的客户是五家正在自己造铲子的人。这就是美国结构里英伟达的真实处境。

token 的工厂，没有业主也没有租客

再看中国那半边。

中国前四大云厂商——阿里云、字节火山引擎、腾讯云、百度智能云——全部都同时在做两件事：一边卖算力，一边做自己的大模型。阿里云的底下是千问（Qwen），火山引擎的底下是豆包和Seedance，腾讯云的底下是混元，百度智能云的底下是文心。再加上对于对于AI “新势力”们错综复杂的投资，产业布局都很完备。

中国的云厂商只能同时做业主和租客——自己造算力、自己造模型、自己消化 token，最后把 token 作为商品卖给下游企业。算力、模型、应用三层被同一家公司吃掉，整条价值链上只剩下一种东西可以作为商品出货——token。

阿里是这个链条的代表性企业， ATH大家都很熟悉了：CEO吴泳铭在内部备忘录里给它定下了核心使命：“创造Token、输送Token、应用Token。”ATH 成立后的一个月，阿里的动作密度是过去两年之最。

3 月30日发布Qwen3.5-Omni——Qwen系列近年来第一次从开源走向闭源。紧接着Qwen 3.6 Plus在OpenRouter上以4.6万亿/周的调用量登顶全球大模型周调用量冠军，同系列的Preview版本拿下第三。今天，ATH又掏出了最新的开放式世界模型产品Happy Oyster，研发效率堪称恐怖。

吴泳铭在 3 月19日的财报电话会上说了一句话，分量比ATH成立本身更大。他说：企业在消耗 Token 时不再把它当作 IT 预算，而是当作生产资料。IT 预算是成本项，是被优化的对象；生产资料是投入项，是被扩张的对象。一家万亿美金市值的中国公司的CEO在财报电话会上告诉华尔街——token已经从“支出”变成了“投入”，从“IT科目”变成了“经济活动本身”。他给出的具体数字是：未来五年，阿里云和AI商业化年收入要冲到1000亿美元。按新的Token消耗算法，这1000亿美元甚至可以包含电商业务产生的AI收入。

在企业的动作之前，监管则是更早给这场科技的盛宴定下了基调。3 月23日，国家数据局局长刘烈宏在中国发展高层论坛年会上正式把token的中文译名定为“词元”，并称其为“智能时代的价值锚点”和“连接技术供给与商业需求的结算单位”。第二天国新办发布会上，他公布了一组官方数字——中国日均词元调用量突破140 万亿，对比2024 年初的1000 亿，两年增长超过一千倍。

这是把 token 从技术概念抬升为经济统计指标的动作。“流量”之于互联网时代，“词元”之于AI时代。OpenRouter平台给了这套叙事最硬的数据支点——2月9日至15日那一周，中国大模型的 Token 调用量首次超过美国，4.12 万亿对 2.94 万亿。到 4 月初，中国模型周调用量达到12.96万亿，美国模型3.03万亿，中国已经连续五周领先，全球调用量前六全部是中国模型。MiniMax M2.5发布后七天调用量突破3.07万亿。Kimi K2.5发布不到一个月，近20天累计收入超过了月之暗面2025全年总收入。智谱GLM-5在春节期间因为流量爆单，公开“寻找算力合伙人”——不是营销噱头，是真实订单把产能撑爆了。

算一下结构差异。美国那半边，算力是核心资产，token 是算力的副产品。中国这半边反过来——token是核心商品，算力是生产token的原料。定价逻辑、商业模型、公司估值、监管指标，全部围绕两种不同的东西展开。

大洋那边充满了算力，但 token 却源源不断从大洋这边产生。

老黄为什么焦虑

回到 Dwarkesh 的播客。

黄仁勋在访谈里给出一个他反复使用的框架——“five-layer cake”，AI产业有五层：能源、芯片、系统、模型、应用。他说美国必须在五层里每一层都领先，否则就是败局。他说中国是全世界开源软件最大的贡献者，说这话时连说两次“Fact”——事实、事实。他说中国占全球AI研究员的一半，制造全球60%以上的主流芯片，有大量满电空置的“幽灵数据中心”。他说AI的大部分进步来自算法进步，不是硬件本身。然后他抛出一句话——如果 DeepSeek 的下一个版本首发在华为芯片上，对美国来说是灾难。

这些话串在一起读，意思已经很清楚了。他的焦虑不是来自“中国追上来”这种宏观叙事，而是来自一个明确的尴尬窘境——在美国那半边，他正在失去议价权；在中国那半边，他正在失去入场券。

在美国那半边：5家hyperscaler拿走了67%的全球算力，它们是他最大的客户，也是他最强的对手。它们每一家都在做自研芯片——Meta刚签了1GW的Broadcom订单，Amazon的Trainium拿下了Anthropic，Google的TPU在吞噬Nvidia的份额。当你的客户同时是你的对手，当你的市场集中到只剩5家买主，你的定价权就是一个慢慢被蚕食的过程。Anthropic拿了Nvidia100亿美元投资两个月后反手加大TPU合作——这件事是趋势，不是偶然。

在中国那半边：token生态正在绕过英伟达。DeepSeek V4的蓄势待发，在华为Ascend 950PR上跑训练和推理，不走Nvidia。阿里、字节、腾讯为此批量下单了几十万片华为芯片。Qwen、Kimi、MiniMax们每周产出几万亿token的模型，每多跑一天，华为芯片的装机量就涨一天。更严重的是，这些模型的用户正在全球扩张——OpenRouter上中国模型连续五周超过美国，MiniMax主打“1美元跑一小时AI数字员工”，Kimi的海外付费用户正在反超国内。当世界开发者的默认技术栈开始从英伟达切换到华为，Nvidia 在这条链路上一个字都插不进去。

面对这两个困境，英伟达过去半年做了两件事，都可以在这个命题下被重新解读。

第一件事，亲自下场做自己本不该做的产品。3 月的GTC上，Nvidia连发Cosmos 3（世界基础模型）、Isaac GR00T N1.7（机器人）、Alpamayo1.5（自动驾驶）、Nemotron（开源大模型家族）——一整套覆盖物理AI和前沿模型的栈。4月14日世界量子日，它发布Ising——开源的量子AI模型家族，黄仁勋亲自给它定性：“AI成为控制面，成为量子机器的操作系统。”这些发布加在一起传递的信号非常明确：英伟达不再满足于做芯片，它要做模型、做操作系统、做物理世界的模拟器、做量子计算的控制层。卖铲子的人开始自己挖矿，不是因为贪心，是因为两个结构都在挤压他的原有位置。

第二件事，他把公司的核心指标从“算力”迁移到“产出”。“electrons to tokens”这个比喻他在Dwarkesh访谈里用了不下五次。他把Nvidia形容成“全球每瓦生产token最多的架构”——不是每瓦算力最多，是每瓦token最多。一家把核心指标从“算力”改成“token”的公司，已经承认了这个时代的硬通货在哪里。

但承认不等于解决。他手里的 GPU 本质上还是生产算力的机器，不是直接生产token的机器。他在两个结构里都在做对的事——在美国扩张上游、在技术栈上锁住开发者——但这些动作都没法改变基本面：算力和token不在同一个平面上。一家只生产算力的公司，无论怎么重新定义自己，都没法同时占据两种权力。

只做卖铲人，已经不能让 Nvidia 高枕无虞了。

结语

AI 时代的权力结构，现在已经分成了两半。

美国那半边是地产——5家hyperscaler坐在67%的全球算力上，前沿lab是它们的租客。这个结构里，算力是硬资产，估值逻辑是“地皮面积×租金”。中国这半边是工厂——4家云厂把算力、模型、应用压成一条流水线，token是唯一的出货物。这个结构里，token 是硬通货，估值逻辑是“产出量×单价”。

两种结构互相不可吃掉。美国的算力地主没法直接进入中国的 token 工厂——监管、生态、开发者习惯都拦着。中国的token工厂也没法直接替代美国的算力地主——前沿训练还是要最先进的硬件，华为Ascend追得再快，短期内补不上与顶级Nvidia芯片的代际差距。两种权力各自运转，各自扩张，各自找各自的出口。

黄仁勋夹在中间。他本来以为自己是这个时代最大的赢家——算力是上游，模型是下游，他给上游和下游都供货，他是唯一的瓶颈。但瓶颈的位置正在双向松动。上游那半边，5家地主自己造芯片；下游那半边，中国用国产芯片跑出了自己的token生态。向左扩张（投资OpenAI、Anthropic）没守住下游，往右扩张还没证明能守住技术栈。他一个人，两条战线，都面临着增长的困境。

他在播客里说，“必须有东西把电子变成token”。他是在替英伟达的未来辩护，但这句话本身已经承认了——这个时代的硬通货不是电子，是token。而生产token最密集的地方，目前不在美国。

他在两种结构之间，Nvidia正在失去最舒服的位置。

群发资讯网

老黄可能开始焦虑了

热门分类