2026 年 2 月,OpenRouter 公布了一组让华盛顿坐立不安的数据:平台上最受欢迎的前三个模型,全部来自中国——MiniMax M2.5、Kimi K2.5、智谱 GLM-5。中国模型在前十名中占据了 61% 的 token 消耗量。一周之内,中国大陆模型处理了 4.1 万亿个 token,超过了美国模型的 2.9 万亿。
这是 Token 出海最辉煌的时刻。但也恰恰是转折点。
因为这组数据不是在证明中国 AI 的胜利——它在触发一场结构性的反制。
Token 出海的降温不是市场周期,而是地缘政治因果链的必然终点。
如果你觉得这个判断太重了,请跟我沿着这条因果链往上追溯。你会发现,它的起点不是贸易战,不是关税,而是芯片——更准确地说,是芯片战场上正在发生的一场「重心转移」。
Dylan Patel(SemiAnalysis 创始人)最近的一次深度访谈里,有一段分析揭示了 AI 硬件格局正在发生的结构性变化:AI 的算力需求正在从训练侧向推理侧大规模转移。
这意味着什么?
过去三年,NVIDIA 的统治地位建立在「训练为王」的逻辑上——训练大模型需要极致的算力密度和互联带宽,只有 NVIDIA 的 A100/H100/B200 生态能满足。但现在,随着大模型进入「够用」阶段(基础模型的能力差距在缩小),竞争焦点正在从「谁能训练出更强的模型」转向「谁能更便宜、更快地跑推理」。
这个转移对 NVIDIA 是致命的。
在推理侧,NVIDIA 的护城河远没有训练侧那么深。 NVIDIA 收购 Groq 就是一个信号——通用 GPU 虽然适合训练,但在极速推理(Decode)场景下成本太高,如果不推出专用方案就会被击败。CPX 芯片专为处理上下文(KV Cache)而生,适合计算密集的视频生成任务。NVIDIA 不得不从「一种芯片打天下」转向「多种专用芯片组合防守」。
而推理恰恰是中国的优势地带。
中国在推理侧有三个结构性优势:
Patel 对中国半导体生态的描述证实了这一点:
当训练→推理的转移完成,最大的赢家不是 NVIDIA,而是华为。 因为华为的芯片在推理场景的性价比、中国的低电价、以及 DeepSeek 级别的高效模型三者叠加,会形成一个中国在 token 供给端的系统性价格优势——就像二十年前中国在商品制造端的价格优势一样。
芯片博弈是政治逻辑。但 Token 出海降温还有一条同样重要的经济逻辑——华尔街。
2026 年,科技巨头在 AI 基础设施上的资本支出达到约 5000 亿美元。支撑这个数字的不是当下的收入(AI 行业收入约 1000 亿美元),而是一个信念:缩放定律(Scaling Laws)继续生效,投入更多算力 → 产出更强模型 → 收获更高回报。
这 5000 亿美元的投入,本质上是华尔街对一个叙事的押注:AI 是未来十年科技股增长的唯一引擎。而 NVIDIA 是这个引擎的引擎。
现在你理解华尔街的至暗恐惧了吗?
2025 年初,DeepSeek 发布 R1 的那个周末,NVIDIA 单日市值蒸发近 6000 亿美元。那只是模型层面的「DeepSeek 时刻」——一个中国团队用更少的算力做出了接近最强模型的性能,市场立刻恐慌:如果不需要那么多 GPU 了怎么办?
但如果「DeepSeek 时刻」发生在芯片层面呢? 如果华为的推理芯片在性价比上真正逼近甚至超越 NVIDIA,同时叠加中国的低电价和高效模型——那不仅是 NVIDIA 一家公司的危机,而是整个美股 AI 叙事的地基被抽掉。
苹果、微软、英伟达、谷歌、Meta、亚马逊、特斯拉——这七家公司的市值占美股总市值的三分之一以上。它们的估值逻辑已经和 AI 叙事深度绑定。如果中国在 token 供给端形成价格碾压,那 5000 亿美元的 CAPEX 投入就会从「远见卓识」变成「错误押注」。
这不是一个商业问题。这是一个国运问题。
所以你会看到一个看似矛盾的政策组合:
底层逻辑是:华尔街可以容忍卖芯片给中国(因为 NVIDIA 需要短期收入),但绝不能容忍中国 token 锁定全球开发者——因为这会从根本上瓦解美股 AI 叙事的根基。
中国在 token 供给端正在形成的价格优势——低电价 + 高效模型 + 国产推理芯片——就像二十年前「中国制造」的价格优势一样强大。而美国的应对方式也会一样:贸易保护主义。不是关税,而是合规壁垒、数据安全审查、实体清单——把中国的 token 价格优势隔绝在美国市场之外。
如果你做过出海业务,你一定熟悉这个模式:
2018 年中美贸易战后,中国制造商并没有停止出口——它们把产能转移到了越南、泰国、印尼。零件在中国生产,最终组装在东南亚完成,贴上「Made in Vietnam」的标签运往美国。
Token 贸易不会消失。但 Token 贸易的「越南时刻」会很快到来。
这个转移可能以三种模式出现:
这是最直接的路径。把 GPU 集群和数据中心搬到中立国——马来西亚、印尼、沙特——在当地生产 token,再向全球交付。就像制造业的产能外迁一样,物理性地改变 token 的「产地标签」。
证据已经非常清楚:
新加坡成为 AI 的「香港」。 NVIDIA 大约五分之一的收入来自新加坡——一个人口只有 600 万的城市国家。这显然不是因为新加坡本地消耗了这么多算力,而是因为它成了中国公司获取先进芯片和部署 AI 基础设施的中转枢纽。
马来西亚柔佛州变成了「AI 工厂」。 截至 2026 年初,马来西亚有 34 个运营中的数据中心和 33 个在建项目。NVIDIA 与 YTL 合资 43 亿美元,字节跳动计划投入 21 亿美元。阿里巴巴和字节跳动在东南亚数据中心训练 AI 模型——目的之一就是在海外获取 NVIDIA 的高端芯片。
一种更激进的模式正在浮现:在中国国内发电(利用西部的低成本清洁能源),通过跨境输电线路把电力运到邻国(比如越南、老挝),在邻国的数据中心里生产 token,再从邻国向全球交付。
这听起来像科幻?其实不是。中国已经向越南和老挝出口电力,跨境输电基础设施早就存在。天能集团在马来西亚建设的「光储算一体化」项目就是这个逻辑的雏形——把能源和算力打包成一个一体化的基础设施方案。
最隐蔽的模式:Token 在中国国内的数据中心生产,但通过 OpenRouter、Together AI 这类海外 API 聚合平台中转,以「平台服务」而非「中国模型 API」的身份触达欧美开发者。
这跟货物贸易中的转口贸易一模一样——货物从中国出发,经香港或新加坡转口,在贸易单据上变成了「香港出口」或「新加坡出口」。
事实上,OpenRouter 的数据之所以让华盛顿紧张,恰恰是因为它暴露了这种转口贸易的规模已经大到无法忽视。
答案不是一个国家,而是一对组合:新加坡做编排,马来西亚做算力。
但如果非要选一个最大的受益国,我的判断是:马来西亚。
原因有三:
1. 物理空间 + 能源优势。 新加坡面积只有 733 平方公里,电力容量接近上限。马来西亚柔佛州与新加坡一桥之隔,土地几乎无限供应。更关键的是:马来西亚有天然气、太阳能和水电资源,可以为数据中心提供低成本的稳定电力——这是推理密集型 AI 算力的命脉。
2. 中国资本的首选落地点。 天能集团 2026 年初的 1GWh「光储算一体化」项目就在马来西亚。马来西亚的华人人口比例(约 23%)也让商务沟通更顺畅。东南亚已成为中国境外最大的中资数据中心投资集中地,而马来西亚是其中最大的目的地。
3. 地缘政治灰色地带。 马来西亚不是美国的条约盟友,与中国经贸关系深厚,同时不是美国会主动对抗的国家。这个「灰色地带」定位,对需要在中美之间走钢丝的 AI 基础设施投资来说,恰恰是最安全的。
预测:到 2028 年,马来西亚将成为全球前五的 AI 算力节点——不是因为它自己的 AI 产业多强,而是因为它是中美科技博弈中最大的「地理套利」受益者。
Token 出海(卖 API)受制于模型品牌、数据合规和地缘政治风险。但算力基础设施(数据中心、GPU 集群运维、能源解决方案)是物理性的——建好了就搬不走,也不受「是中国模型还是美国模型」的争议影响。
不要去地缘政治立场明确的国家(比如日本、韩国对美关系太紧密;缅甸、柬埔寨则风险太高)。马来西亚、印尼、泰国、沙特——这些在中美之间保持模糊的国家,才是 AI 基础设施最好的落地点。
这个双城走廊正在成为亚太版的「旧金山-圣何塞」——新加坡是金融和商务枢纽,柔佛是算力工厂。如果你的业务涉及 AI 基础设施出海,这是目前最值得关注的地理单元。
每次中美博弈升级,都会有一批邻国成为「渔翁得利」的受益者。
二十年前是越南和泰国承接了中国的制造业外溢。十年前是印度和印尼承接了中国的互联网模式输出。
现在,轮到马来西亚和新加坡承接中国的 AI 算力外溢了。
这不是巧合,这是结构。当两个大国在某个领域正面碰撞时,紧挨着它们的小国总会找到「中间商」的机会。
Token 出海的降温不是终点——它是 AI 算力贸易「越南路线」的起点。
一句话总结: 训练→推理的转移让中国拿到了 token 定价权,华尔街把这视为比 DeepSeek 更深层的威胁。当 token 贸易壁垒竖起来时,受益的不是中国也不是美国——是马来西亚。
参考来源:SemiAnalysis Dylan Patel 深度访谈、OpenRouter 2026 年 2 月数据、Asia Times 报道