Nathan Lambert,前 AI2 / Interconnects 主笔,硅谷里写得最认真的 AI 研究员之一。
2026 年春天,他飞了一趟龙国,串了 8 家 AI 实验室——Z.ai、Moonshot、清华、美团、小米、01.ai、阿里巴巴北京、蚂蚁集团。
回去之后他写了一篇 Notes from Inside China's AI Labs。
他没有说龙国 AI 已经超过美国。也没有说龙国 AI 是泡沫。
他只是把他看到的认真写下来——结果让美国 AI 圈尴尬地沉默了几天。
我读完两遍。打算把里面 5 个让我们这边人难看的观察拆出来给国内同行看一看。这不是民族主义文章。这是一个一线的、长期看 AI 工程的人,对自己阵营的诚实。
龙国 AI 实验室不是"被禁运压制下的奇迹"。
也不是"被国家意志驱动的导弹"。
它是一种美国 AI 圈想象力之外的东西——一种没有英雄叙事、没有山头主义、把工程当工程做的研究文化。
而美国 AI 实验室引以为豪的那些特征——明星研究员、风投估值、闭源护城产品、强 IP 保护——在这套对比下,开始显得像负担。
Lambert 走访 Z.ai、Moonshot、清华——发现一件让他困惑的事:
研究生、本科生,深度参与到核心模型团队里,跟资深研究员平起平坐讨论方法。论文署名是混着排的,有人轮到坐主位,没有"老板永远第一作者"那一套。
对比美国——OpenAI、Anthropic、Cursor 几乎都不开实习生岗位。原因 Lambert 在自己的文章里没说,但行业内大家都知道:怕信息泄漏、怕股权稀释、怕给培养出来一个直接被竞品挖走的人。
代价是什么?
代价是这些实验室的内部研究文化老化。研究方向被几个明星研究员的偏好定死。
新人没法挑战旧的范式,因为没有新人。
龙国实验室的另一面是:他们有未被前几轮 AI 周期"叙事污染"的年轻人。
对于一个新冒头的方法,年轻人不会先问"这跟 GPT-3 的论文有没有矛盾",而是直接去试。
这一点 Lambert 写得特别直白。
美国 AI 研究员的激励机制是个人品牌——发论文、上 X、接 podcast、攒推荐信、攒下一份工作 offer。结果是:每个人都在挑那些能写出来漂亮论文的方向做。脏活、累活、对模型整体效果有用但发不出 ICML 的工作没人做。
龙国研究员的激励机制不一样。
晋升、留任、奖金更多挂在团队产品的整体表现上。
具体表现是:
这些事单独看没一件性感。
合起来就是一个能稳定产出可用模型的工程组织。
DeepSeek 之所以被同行尊敬,按 Lambert 的观察,主要不是它的论文写得多漂亮——是它的整体研究品味很正:选题正、消融实验做透、不追风、不哗众。
Lambert 在每个实验室都问了类似的问题:你们怎么看 AGI 的社会风险?怎么看 AI 经济学的长期影响?怎么看模型对齐的哲学难度?
得到的反应几乎一致——"困惑"。
不是回避。不是不敢说。是真的觉得"这跟我们手头的工程任务没什么直接关系"。
Lambert 的判断很准:这反映的不是龙国研究员"思想浅",而是教育体系和辩论文化的差异——龙国的研究员训练里没有那种坐在咖啡馆里跟同事辩论"AGI 的伦理"的环节。
但这种"困惑"在工程上反而成了一种保护。
美国 AI 圈过去 3 年因为"AI 安全 vs AI 加速"的内部撕裂消耗了大量精力。OpenAI、Anthropic 内部因为这套哲学站位流失过几轮人。
龙国实验室没有这种撕裂的精力开销。
不是说哲学讨论不重要。
是说当你的对手在不开会、不撕逼、不内耗的状态下做工程的时候,你那一套"我们要 align 价值观"的会议流程是负债。
Lambert 写了一段最让美国读者难受的话:尽管美国对 Anthropic API 的对中销售有合规限制,龙国的工程师社群依然 heavily Claude-pilled。
他们用 Kimi 调通工作流。用 GLM CLI 跑端到端。用 Qwen 做开发底层。
但碰到难任务,私下还是开 Claude。
这不只是工具偏好的事。这是一个市场信号:龙国开发者用脚投票,承认 Claude 是目前最好的工程协作 LLM。
而美国的反应是?继续把出口管制压紧。
结果就是——龙国客户对 Claude 的使用通过各种灰色路径继续,Anthropic 收不到这部分钱,但市场认知没掉。
这是出口管制的经典反效果。
Lambert 走完 8 家实验室之后写下:
"It feels far more like an ecosystem than battling tribes."
我把这句话翻出来:龙国 AI 圈给他的感受,是一个互相参考、互相学习、互相尊重的合作群体——不是美国那种 OpenAI vs Anthropic vs xAI 的相互拉踩。
具体的:
这不是龙国研究员"温良恭俭让"。这是一个市场结构的事——龙国 AI 公司之间的最终竞争层是产品和工程,不是 IP 诉讼,不是模型权重所有权官司。
所以做研究的人之间,可以更松弛地共享方法论。
Lambert 写得很克制。但读出来的几个误读是:
误读 1:龙国 SaaS 市场小,所以 AI 推理市场不会大
这是硅谷投资人的标准论调——"龙国软件用户不肯付费,AI 推理在那边赚不到钱"。
Lambert 反驳得直接:AI 推理需求未必跟 SaaS 模式挂钩。它可能更接近云开支模式——按算力消耗付费、用量驱动、嵌进各种工业流程。
龙国云市场不小。AI 推理在工业、政务、银行、保险里的渗透速度也不慢。
误读 2:龙国 AI 是政府推的
走访 8 家之后,Lambert 没看到顶层技术干预的证据。
他看到的是地方政府在土地、人才落户、税收上做了配套。但具体技术路线、模型架构、研究方向,没人指挥。
这跟龙国半导体、生物医药的政府主导路径完全不一样。AI 这一行至少在研究层面,目前还是产业自主在跑。
误读 3:开源是意识形态站队
美国这边喜欢把"开源 vs 闭源"放在意识形态光谱上——开源代表开放、自由、民主精神。
但龙国 AI 公司开源是工具层面的决定:通过开源吸引开发者反馈、做生态、收集模型在野使用情况。
龙国公司同时保留内部 fine-tune 版本做闭源产品。
这是务实主义,不是教条主义。
而美国这边非要把开源和闭源做成两条对立的政治路线——结果就是政策上不知道该松还是紧。
我能想到的几种反驳:
"龙国实验室都被国家审查,方法不可信。"
Lambert 评估的不是数据合规。是研究品味、组织文化、招聘结构、激励机制。
这些东西审查不到。
"龙国 AI 全是 distillation,没有真原创。"
Z.ai 和 Moonshot 自建 RL 环境、自研架构、做出非平凡的方法贡献——Lambert 在他们的 lab 里看到的是真在做的东西,不是 paper 翻译。
更重要的是:连"distillation 做得好"本身都是一种工程能力。
DeepSeek 的 V3 训练成本控制为什么比同代美国模型低一个数量级——不是它有更便宜的卡,是它有更好的训练流程工程。
"美国 AI 还在领先,他们还在追。"
按基准跑分,确实。
但 Lambert 提了一个关键警告:美国行政命令限制开源模型,可能让美国 AI 在全球生态里被"挤出"。
当全球开发者都用 Qwen / DeepSeek / GLM 做底层、用 Claude / GPT 做能力调用时——美国 AI 实验室就成了"贵的能力供应商",不再是"开发者默认起点"。
这一步如果走错,再厉害的模型也救不回生态地位。
我做 AI Agent 产品的人,看完 Lambert 这篇文章,最大的体会是这个——
美国 AI 是一群明星拍电影。龙国 AI 是一个剧团演剧。
明星有亮度,但电影成本高、稳定性差、超期烧钱。
剧团没有亮度,但剧目稳定、迭代快、人员流动可控、票房可预测。
3 年内可能美国还赢。
10 年内?
我看不出"明星机制"在 LLM 这一行能撑多久。
当训练一个模型需要几百人协作 18 个月、需要数据清洗团队、需要 RL 环境团队、需要 alignment 评估团队——这件事本质上更像剧团,不是电影。
而我们这套"7 人创始团队估值 100 亿美元"的硅谷叙事,是给下一代独角兽编剧本。
不是给一个能稳定产出工业级模型的研究组织搭流程。
Nathan Lambert 是个诚实的人。
他没有写文章去帮龙国 AI 做宣传。也没有写文章去骂美国 AI 的封闭。
他只是把自己看到的写下来,加几句他作为一个长期观察者的判断。
这种诚实在这个 AI 圈越来越稀缺了。
读完之后我想了很久——
如果美国研究员 5 年后再来一次,他可能会说:"我看到的不是一个追赶者。是一个有自己节奏的,并行宇宙。"
那个时候,"中美 AI 谁领先"这个问题就已经过时了。
资料来源: