Token 出海降温：当 AI 算力也走上「越南路线」

2026 年 2 月，OpenRouter 公布了一组让华盛顿坐立不安的数据：平台上最受欢迎的前三个模型，全部来自中国——MiniMax M2.5、Kimi K2.5、智谱 GLM-5。中国模型在前十名中占据了 61% 的 token 消耗量。一周之内，中国大陆模型处理了 4.1 万亿个 token，超过了美国模型的 2.9 万亿。

这是 Token 出海最辉煌的时刻。但也恰恰是转折点。

因为这组数据不是在证明中国 AI 的胜利——它在触发一场结构性的反制。

Token 出海的降温不是市场周期，而是地缘政治因果链的必然终点。

如果你觉得这个判断太重了，请跟我沿着这条因果链往上追溯。你会发现，它的起点不是贸易战，不是关税，而是芯片——更准确地说，是芯片战场上正在发生的一场「重心转移」。

一、因果链的源头：从训练到推理的权力转移

Dylan Patel（SemiAnalysis 创始人）最近的一次深度访谈里，有一段分析揭示了 AI 硬件格局正在发生的结构性变化：AI 的算力需求正在从训练侧向推理侧大规模转移。

这意味着什么？

过去三年，NVIDIA 的统治地位建立在「训练为王」的逻辑上——训练大模型需要极致的算力密度和互联带宽，只有 NVIDIA 的 A100/H100/B200 生态能满足。但现在，随着大模型进入「够用」阶段（基础模型的能力差距在缩小），竞争焦点正在从「谁能训练出更强的模型」转向「谁能更便宜、更快地跑推理」。

这个转移对 NVIDIA 是致命的。

在推理侧，NVIDIA 的护城河远没有训练侧那么深。 NVIDIA 收购 Groq 就是一个信号——通用 GPU 虽然适合训练，但在极速推理（Decode）场景下成本太高，如果不推出专用方案就会被击败。CPX 芯片专为处理上下文（KV Cache）而生，适合计算密集的视频生成任务。NVIDIA 不得不从「一种芯片打天下」转向「多种专用芯片组合防守」。

而推理恰恰是中国的优势地带。

中国在推理侧有三个结构性优势：

低成本电力。 推理是一个持续运行的负载，电力成本在总成本中的占比远高于训练。中国的工业电价大约是美国的三分之一到二分之一。这意味着同样的推理工作，中国天然有 30-50% 的成本优势。
高效模型。 DeepSeek 已经证明了这一点——用更少的参数和更低的计算量达到接近甚至匹配 GPT-4 级别的性能。中国的模型团队在「用有限算力做更多事」这件事上，已经形成了系统性的方法论。
国产芯片正在补位。 华为的昇腾系列在推理场景下的性价比正在逼近 NVIDIA。关键在于：推理对芯片的要求不像训练那么极端——你不需要最先进的制程，「够用」的芯片在足够便宜的电力加持下，完全可以和 NVIDIA 正面竞争。

Patel 对中国半导体生态的描述证实了这一点：

半导体在中国已经不仅是国策，而是下沉到社会文化层面。中国出现了以芯片工厂为背景的爱情剧——你在好莱坞绝对看不到这种东西。
产业链极度细分。一个小城市会倾全城之力，只做某种特定的半导体化学材料，然后通过政府补贴形成集群效应。
华为的垂直整合深度全球罕见。受限前它曾超越苹果成为台积电最大客户。

当训练→推理的转移完成，最大的赢家不是 NVIDIA，而是华为。 因为华为的芯片在推理场景的性价比、中国的低电价、以及 DeepSeek 级别的高效模型三者叠加，会形成一个中国在 token 供给端的系统性价格优势——就像二十年前中国在商品制造端的价格优势一样。

二、华尔街的至暗恐惧：芯片上的「DeepSeek 时刻」

芯片博弈是政治逻辑。但 Token 出海降温还有一条同样重要的经济逻辑——华尔街。

2026 年，科技巨头在 AI 基础设施上的资本支出达到约 5000 亿美元。支撑这个数字的不是当下的收入（AI 行业收入约 1000 亿美元），而是一个信念：缩放定律（Scaling Laws）继续生效，投入更多算力 → 产出更强模型 → 收获更高回报。

这 5000 亿美元的投入，本质上是华尔街对一个叙事的押注：AI 是未来十年科技股增长的唯一引擎。而 NVIDIA 是这个引擎的引擎。

现在你理解华尔街的至暗恐惧了吗？

2025 年初，DeepSeek 发布 R1 的那个周末，NVIDIA 单日市值蒸发近 6000 亿美元。那只是模型层面的「DeepSeek 时刻」——一个中国团队用更少的算力做出了接近最强模型的性能，市场立刻恐慌：如果不需要那么多 GPU 了怎么办？

但如果「DeepSeek 时刻」发生在芯片层面呢？ 如果华为的推理芯片在性价比上真正逼近甚至超越 NVIDIA，同时叠加中国的低电价和高效模型——那不仅是 NVIDIA 一家公司的危机，而是整个美股 AI 叙事的地基被抽掉。

苹果、微软、英伟达、谷歌、Meta、亚马逊、特斯拉——这七家公司的市值占美股总市值的三分之一以上。它们的估值逻辑已经和 AI 叙事深度绑定。如果中国在 token 供给端形成价格碾压，那 5000 亿美元的 CAPEX 投入就会从「远见卓识」变成「错误押注」。

这不是一个商业问题。这是一个国运问题。

所以你会看到一个看似矛盾的政策组合：

对芯片出口管制松了一小步：2026 年 1 月，BIS 将 H200 级别芯片对华出口从「推定拒绝」改为「逐案审查」。因为特朗普政府需要在访华前释放善意，同时 NVIDIA 需要中国市场的收入。
但对 token 出海的结构性遏制正在形成：当开发者的代码库、Agent 工作流和产品逻辑都构建在某个中国模型上时，迁移成本会随时间指数级增长。华盛顿看到了这个锁定效应，并开始从数据安全、合规审查等维度收紧。

底层逻辑是：华尔街可以容忍卖芯片给中国（因为 NVIDIA 需要短期收入），但绝不能容忍中国 token 锁定全球开发者——因为这会从根本上瓦解美股 AI 叙事的根基。

中国在 token 供给端正在形成的价格优势——低电价 + 高效模型 + 国产推理芯片——就像二十年前「中国制造」的价格优势一样强大。而美国的应对方式也会一样：贸易保护主义。不是关税，而是合规壁垒、数据安全审查、实体清单——把中国的 token 价格优势隔绝在美国市场之外。

三、Token 贸易的「越南路线」：不会消失，但会变形

如果你做过出海业务，你一定熟悉这个模式：

2018 年中美贸易战后，中国制造商并没有停止出口——它们把产能转移到了越南、泰国、印尼。零件在中国生产，最终组装在东南亚完成，贴上「Made in Vietnam」的标签运往美国。

Token 贸易不会消失。但 Token 贸易的「越南时刻」会很快到来。

这个转移可能以三种模式出现：

模式一：算力外迁

这是最直接的路径。把 GPU 集群和数据中心搬到中立国——马来西亚、印尼、沙特——在当地生产 token，再向全球交付。就像制造业的产能外迁一样，物理性地改变 token 的「产地标签」。

证据已经非常清楚：

新加坡成为 AI 的「香港」。 NVIDIA 大约五分之一的收入来自新加坡——一个人口只有 600 万的城市国家。这显然不是因为新加坡本地消耗了这么多算力，而是因为它成了中国公司获取先进芯片和部署 AI 基础设施的中转枢纽。

马来西亚柔佛州变成了「AI 工厂」。 截至 2026 年初，马来西亚有 34 个运营中的数据中心和 33 个在建项目。NVIDIA 与 YTL 合资 43 亿美元，字节跳动计划投入 21 亿美元。阿里巴巴和字节跳动在东南亚数据中心训练 AI 模型——目的之一就是在海外获取 NVIDIA 的高端芯片。

模式二：电力跨境 + 邻国算力

一种更激进的模式正在浮现：在中国国内发电（利用西部的低成本清洁能源），通过跨境输电线路把电力运到邻国（比如越南、老挝），在邻国的数据中心里生产 token，再从邻国向全球交付。

这听起来像科幻？其实不是。中国已经向越南和老挝出口电力，跨境输电基础设施早就存在。天能集团在马来西亚建设的「光储算一体化」项目就是这个逻辑的雏形——把能源和算力打包成一个一体化的基础设施方案。

模式三：Token 转口贸易

最隐蔽的模式：Token 在中国国内的数据中心生产，但通过 OpenRouter、Together AI 这类海外 API 聚合平台中转，以「平台服务」而非「中国模型 API」的身份触达欧美开发者。

这跟货物贸易中的转口贸易一模一样——货物从中国出发，经香港或新加坡转口，在贸易单据上变成了「香港出口」或「新加坡出口」。

事实上，OpenRouter 的数据之所以让华盛顿紧张，恰恰是因为它暴露了这种转口贸易的规模已经大到无法忽视。

四、谁是最大的受益国？

答案不是一个国家，而是一对组合：新加坡做编排，马来西亚做算力。

但如果非要选一个最大的受益国，我的判断是：马来西亚。

原因有三：

1. 物理空间 + 能源优势。 新加坡面积只有 733 平方公里，电力容量接近上限。马来西亚柔佛州与新加坡一桥之隔，土地几乎无限供应。更关键的是：马来西亚有天然气、太阳能和水电资源，可以为数据中心提供低成本的稳定电力——这是推理密集型 AI 算力的命脉。

2. 中国资本的首选落地点。 天能集团 2026 年初的 1GWh「光储算一体化」项目就在马来西亚。马来西亚的华人人口比例（约 23%）也让商务沟通更顺畅。东南亚已成为中国境外最大的中资数据中心投资集中地，而马来西亚是其中最大的目的地。

3. 地缘政治灰色地带。 马来西亚不是美国的条约盟友，与中国经贸关系深厚，同时不是美国会主动对抗的国家。这个「灰色地带」定位，对需要在中美之间走钢丝的 AI 基础设施投资来说，恰恰是最安全的。

预测：到 2028 年，马来西亚将成为全球前五的 AI 算力节点——不是因为它自己的 AI 产业多强，而是因为它是中美科技博弈中最大的「地理套利」受益者。

五、对出海创业者的三条建议

1. 算力出海比 Token 出海更有确定性

Token 出海（卖 API）受制于模型品牌、数据合规和地缘政治风险。但算力基础设施（数据中心、GPU 集群运维、能源解决方案）是物理性的——建好了就搬不走，也不受「是中国模型还是美国模型」的争议影响。

2. 选择「灰色地带」国家落地

不要去地缘政治立场明确的国家（比如日本、韩国对美关系太紧密；缅甸、柬埔寨则风险太高）。马来西亚、印尼、泰国、沙特——这些在中美之间保持模糊的国家，才是 AI 基础设施最好的落地点。

3. 关注「柔佛-新加坡」走廊

这个双城走廊正在成为亚太版的「旧金山-圣何塞」——新加坡是金融和商务枢纽，柔佛是算力工厂。如果你的业务涉及 AI 基础设施出海，这是目前最值得关注的地理单元。

写在最后

每次中美博弈升级，都会有一批邻国成为「渔翁得利」的受益者。

二十年前是越南和泰国承接了中国的制造业外溢。十年前是印度和印尼承接了中国的互联网模式输出。

现在，轮到马来西亚和新加坡承接中国的 AI 算力外溢了。

这不是巧合，这是结构。当两个大国在某个领域正面碰撞时，紧挨着它们的小国总会找到「中间商」的机会。

Token 出海的降温不是终点——它是 AI 算力贸易「越南路线」的起点。

一句话总结： 训练→推理的转移让中国拿到了 token 定价权，华尔街把这视为比 DeepSeek 更深层的威胁。当 token 贸易壁垒竖起来时，受益的不是中国也不是美国——是马来西亚。

参考来源：SemiAnalysis Dylan Patel 深度访谈、OpenRouter 2026 年 2 月数据、Asia Times 报道