返回博客

Token 出海降温:当 AI 算力也走上「越南路线」

AI出海中美博弈芯片马来西亚Token
封面

2026 年 2 月,OpenRouter 公布了一组让华盛顿坐立不安的数据:平台上最受欢迎的前三个模型,全部来自中国——MiniMax M2.5、Kimi K2.5、智谱 GLM-5。中国模型在前十名中占据了 61% 的 token 消耗量。一周之内,中国大陆模型处理了 4.1 万亿个 token,超过了美国模型的 2.9 万亿。

这是 Token 出海最辉煌的时刻。但也恰恰是转折点。

因为这组数据不是在证明中国 AI 的胜利——它在触发一场结构性的反制。

Token 出海的降温不是市场周期,而是地缘政治因果链的必然终点。

如果你觉得这个判断太重了,请跟我沿着这条因果链往上追溯。你会发现,它的起点不是贸易战,不是关税,而是芯片——更准确地说,是芯片战场上正在发生的一场「重心转移」。

一、因果链的源头:从训练到推理的权力转移

Dylan Patel(SemiAnalysis 创始人)最近的一次深度访谈里,有一段分析揭示了 AI 硬件格局正在发生的结构性变化:AI 的算力需求正在从训练侧向推理侧大规模转移。

这意味着什么?

过去三年,NVIDIA 的统治地位建立在「训练为王」的逻辑上——训练大模型需要极致的算力密度和互联带宽,只有 NVIDIA 的 A100/H100/B200 生态能满足。但现在,随着大模型进入「够用」阶段(基础模型的能力差距在缩小),竞争焦点正在从「谁能训练出更强的模型」转向「谁能更便宜、更快地跑推理」。

这个转移对 NVIDIA 是致命的。

在推理侧,NVIDIA 的护城河远没有训练侧那么深。 NVIDIA 收购 Groq 就是一个信号——通用 GPU 虽然适合训练,但在极速推理(Decode)场景下成本太高,如果不推出专用方案就会被击败。CPX 芯片专为处理上下文(KV Cache)而生,适合计算密集的视频生成任务。NVIDIA 不得不从「一种芯片打天下」转向「多种专用芯片组合防守」。

而推理恰恰是中国的优势地带。

中国在推理侧有三个结构性优势:

  • 低成本电力。 推理是一个持续运行的负载,电力成本在总成本中的占比远高于训练。中国的工业电价大约是美国的三分之一到二分之一。这意味着同样的推理工作,中国天然有 30-50% 的成本优势。
  • 高效模型。 DeepSeek 已经证明了这一点——用更少的参数和更低的计算量达到接近甚至匹配 GPT-4 级别的性能。中国的模型团队在「用有限算力做更多事」这件事上,已经形成了系统性的方法论。
  • 国产芯片正在补位。 华为的昇腾系列在推理场景下的性价比正在逼近 NVIDIA。关键在于:推理对芯片的要求不像训练那么极端——你不需要最先进的制程,「够用」的芯片在足够便宜的电力加持下,完全可以和 NVIDIA 正面竞争。

Patel 对中国半导体生态的描述证实了这一点:

  • 半导体在中国已经不仅是国策,而是下沉到社会文化层面。中国出现了以芯片工厂为背景的爱情剧——你在好莱坞绝对看不到这种东西。
  • 产业链极度细分。一个小城市会倾全城之力,只做某种特定的半导体化学材料,然后通过政府补贴形成集群效应。
  • 华为的垂直整合深度全球罕见。受限前它曾超越苹果成为台积电最大客户。

当训练→推理的转移完成,最大的赢家不是 NVIDIA,而是华为。 因为华为的芯片在推理场景的性价比、中国的低电价、以及 DeepSeek 级别的高效模型三者叠加,会形成一个中国在 token 供给端的系统性价格优势——就像二十年前中国在商品制造端的价格优势一样。

二、华尔街的至暗恐惧:芯片上的「DeepSeek 时刻」

芯片博弈是政治逻辑。但 Token 出海降温还有一条同样重要的经济逻辑——华尔街。

2026 年,科技巨头在 AI 基础设施上的资本支出达到约 5000 亿美元。支撑这个数字的不是当下的收入(AI 行业收入约 1000 亿美元),而是一个信念:缩放定律(Scaling Laws)继续生效,投入更多算力 → 产出更强模型 → 收获更高回报。

这 5000 亿美元的投入,本质上是华尔街对一个叙事的押注:AI 是未来十年科技股增长的唯一引擎。而 NVIDIA 是这个引擎的引擎。

现在你理解华尔街的至暗恐惧了吗?

2025 年初,DeepSeek 发布 R1 的那个周末,NVIDIA 单日市值蒸发近 6000 亿美元。那只是模型层面的「DeepSeek 时刻」——一个中国团队用更少的算力做出了接近最强模型的性能,市场立刻恐慌:如果不需要那么多 GPU 了怎么办?

但如果「DeepSeek 时刻」发生在芯片层面呢? 如果华为的推理芯片在性价比上真正逼近甚至超越 NVIDIA,同时叠加中国的低电价和高效模型——那不仅是 NVIDIA 一家公司的危机,而是整个美股 AI 叙事的地基被抽掉。

苹果、微软、英伟达、谷歌、Meta、亚马逊、特斯拉——这七家公司的市值占美股总市值的三分之一以上。它们的估值逻辑已经和 AI 叙事深度绑定。如果中国在 token 供给端形成价格碾压,那 5000 亿美元的 CAPEX 投入就会从「远见卓识」变成「错误押注」。

这不是一个商业问题。这是一个国运问题。

所以你会看到一个看似矛盾的政策组合:

  • 对芯片出口管制松了一小步:2026 年 1 月,BIS 将 H200 级别芯片对华出口从「推定拒绝」改为「逐案审查」。因为特朗普政府需要在访华前释放善意,同时 NVIDIA 需要中国市场的收入。
  • 但对 token 出海的结构性遏制正在形成:当开发者的代码库、Agent 工作流和产品逻辑都构建在某个中国模型上时,迁移成本会随时间指数级增长。华盛顿看到了这个锁定效应,并开始从数据安全、合规审查等维度收紧。

底层逻辑是:华尔街可以容忍卖芯片给中国(因为 NVIDIA 需要短期收入),但绝不能容忍中国 token 锁定全球开发者——因为这会从根本上瓦解美股 AI 叙事的根基。

中国在 token 供给端正在形成的价格优势——低电价 + 高效模型 + 国产推理芯片——就像二十年前「中国制造」的价格优势一样强大。而美国的应对方式也会一样:贸易保护主义。不是关税,而是合规壁垒、数据安全审查、实体清单——把中国的 token 价格优势隔绝在美国市场之外。

三、Token 贸易的「越南路线」:不会消失,但会变形

如果你做过出海业务,你一定熟悉这个模式:

2018 年中美贸易战后,中国制造商并没有停止出口——它们把产能转移到了越南、泰国、印尼。零件在中国生产,最终组装在东南亚完成,贴上「Made in Vietnam」的标签运往美国。

Token 贸易不会消失。但 Token 贸易的「越南时刻」会很快到来。

这个转移可能以三种模式出现:

模式一:算力外迁

这是最直接的路径。把 GPU 集群和数据中心搬到中立国——马来西亚、印尼、沙特——在当地生产 token,再向全球交付。就像制造业的产能外迁一样,物理性地改变 token 的「产地标签」。

证据已经非常清楚:

新加坡成为 AI 的「香港」。 NVIDIA 大约五分之一的收入来自新加坡——一个人口只有 600 万的城市国家。这显然不是因为新加坡本地消耗了这么多算力,而是因为它成了中国公司获取先进芯片和部署 AI 基础设施的中转枢纽。

马来西亚柔佛州变成了「AI 工厂」。 截至 2026 年初,马来西亚有 34 个运营中的数据中心和 33 个在建项目。NVIDIA 与 YTL 合资 43 亿美元,字节跳动计划投入 21 亿美元。阿里巴巴和字节跳动在东南亚数据中心训练 AI 模型——目的之一就是在海外获取 NVIDIA 的高端芯片。

模式二:电力跨境 + 邻国算力

一种更激进的模式正在浮现:在中国国内发电(利用西部的低成本清洁能源),通过跨境输电线路把电力运到邻国(比如越南、老挝),在邻国的数据中心里生产 token,再从邻国向全球交付。

这听起来像科幻?其实不是。中国已经向越南和老挝出口电力,跨境输电基础设施早就存在。天能集团在马来西亚建设的「光储算一体化」项目就是这个逻辑的雏形——把能源和算力打包成一个一体化的基础设施方案。

模式三:Token 转口贸易

最隐蔽的模式:Token 在中国国内的数据中心生产,但通过 OpenRouter、Together AI 这类海外 API 聚合平台中转,以「平台服务」而非「中国模型 API」的身份触达欧美开发者。

这跟货物贸易中的转口贸易一模一样——货物从中国出发,经香港或新加坡转口,在贸易单据上变成了「香港出口」或「新加坡出口」。

事实上,OpenRouter 的数据之所以让华盛顿紧张,恰恰是因为它暴露了这种转口贸易的规模已经大到无法忽视。

四、谁是最大的受益国?

答案不是一个国家,而是一对组合:新加坡做编排,马来西亚做算力。

但如果非要选一个最大的受益国,我的判断是:马来西亚。

原因有三:

1. 物理空间 + 能源优势。 新加坡面积只有 733 平方公里,电力容量接近上限。马来西亚柔佛州与新加坡一桥之隔,土地几乎无限供应。更关键的是:马来西亚有天然气、太阳能和水电资源,可以为数据中心提供低成本的稳定电力——这是推理密集型 AI 算力的命脉。

2. 中国资本的首选落地点。 天能集团 2026 年初的 1GWh「光储算一体化」项目就在马来西亚。马来西亚的华人人口比例(约 23%)也让商务沟通更顺畅。东南亚已成为中国境外最大的中资数据中心投资集中地,而马来西亚是其中最大的目的地。

3. 地缘政治灰色地带。 马来西亚不是美国的条约盟友,与中国经贸关系深厚,同时不是美国会主动对抗的国家。这个「灰色地带」定位,对需要在中美之间走钢丝的 AI 基础设施投资来说,恰恰是最安全的。

预测:到 2028 年,马来西亚将成为全球前五的 AI 算力节点——不是因为它自己的 AI 产业多强,而是因为它是中美科技博弈中最大的「地理套利」受益者。

五、对出海创业者的三条建议

1. 算力出海比 Token 出海更有确定性

Token 出海(卖 API)受制于模型品牌、数据合规和地缘政治风险。但算力基础设施(数据中心、GPU 集群运维、能源解决方案)是物理性的——建好了就搬不走,也不受「是中国模型还是美国模型」的争议影响。

2. 选择「灰色地带」国家落地

不要去地缘政治立场明确的国家(比如日本、韩国对美关系太紧密;缅甸、柬埔寨则风险太高)。马来西亚、印尼、泰国、沙特——这些在中美之间保持模糊的国家,才是 AI 基础设施最好的落地点。

3. 关注「柔佛-新加坡」走廊

这个双城走廊正在成为亚太版的「旧金山-圣何塞」——新加坡是金融和商务枢纽,柔佛是算力工厂。如果你的业务涉及 AI 基础设施出海,这是目前最值得关注的地理单元。

写在最后

每次中美博弈升级,都会有一批邻国成为「渔翁得利」的受益者。

二十年前是越南和泰国承接了中国的制造业外溢。十年前是印度和印尼承接了中国的互联网模式输出。

现在,轮到马来西亚和新加坡承接中国的 AI 算力外溢了。

这不是巧合,这是结构。当两个大国在某个领域正面碰撞时,紧挨着它们的小国总会找到「中间商」的机会。

Token 出海的降温不是终点——它是 AI 算力贸易「越南路线」的起点。


一句话总结: 训练→推理的转移让中国拿到了 token 定价权,华尔街把这视为比 DeepSeek 更深层的威胁。当 token 贸易壁垒竖起来时,受益的不是中国也不是美国——是马来西亚。

参考来源:SemiAnalysis Dylan Patel 深度访谈、OpenRouter 2026 年 2 月数据、Asia Times 报道