把这件事的事实先摆出来:
| 时间 | 事件 |
|------|------|
| 2025-12-11 | GPT-5.2 发布 |
| 2025-12 ~ 2026-01 | Lupsasca 用 GPT-5.2 解 Strominger 提了一年的 gluon 振幅问题,1 周搞定 |
| 2026-02 | 推广到 graviton,1 天 110 页 |
| 2026-02-12 | gluon 论文 arXiv 上线(编号 2602.12176) |
| 2026-02 | OpenAI 官博、Harvard Gazette、Science、Phys.org 等媒体报道 |
| 2026-05-05 | latent.space 发布 Lupsasca 访谈,使用"Vibe Physics"这一名词 |
中间这 3 个月,事实没变。新发现没增加。
变的只有一件事——这种工作模式被起了个名字。
我之前差点把这件事当成"AI 圈新爆点"来写。后来核了下时间线,发现题目本身已经被中英文圈写过一波。
但命名值得重新写一遍——它做的事跟新闻报道完全不一样。
一种做事的方式被命名,意味着三件事正在同时发生:
Vibe Physics 同时具备这三个特征:
这就是命名的力量。它把一种实践从工具层面("我用 AI 算了点东西")抬升到方法层面("我属于这一派")。
Lupsasca 起这个名字不是临时起意。
"Vibe Coding"已经是过去 18 个月 AI 圈在 X 上最广泛的概念之一——Karpathy 2024 年提出,2026 年初被卡帕西本人宣告"已经过时",但作为词条已经深入人心。
把"Vibe"前缀粘在"Physics"前面,是利用现有认知。
但有个问题:这两件事在工作机制上是反着的。
Vibe Coding 的核心:放弃读代码,靠运行结果判断对错。
Vibe Physics 的核心:放弃手算每一步,靠领域专家自己判断 AI 中间步骤是否合理。
共享一个"Vibe"前缀,让大众读者隐隐以为门槛差不多。其实门槛差了一个量级。
这是命名学上的一个经典风险:前缀借势带来传播红利,但同时遗传了语义错配。
我能预判,未来 6-12 个月内,"Vibe Physics"这个词会被以下 3 类人滥用——而每一类滥用都会消耗这个词原本的精度。
1. 想挂"AI 协同研究"标签发文章的博士生
PhD 学生写自己的毕业论文,AI 给一个推导,他不知道哪一步对、哪一步错。但他会写"本研究采用 Vibe Physics 方法"。
3 年后会有一波这种论文被反驳到撤稿。
2. 跨领域抄题的"AI for Science"创业者
"我们做 Vibe Chemistry / Vibe Biology / Vibe Economics"——但化学反应、生物系统、经济模型,要么领域积累不够,要么结果不可独立验证。
照搬 Lupsasca 的工作流,会输出大量"看起来合理"但没法验证的内容。
3. 把 Vibe Physics 当成 Vibe Coding 升级版的 AI 产品营销
"用我们的工具,物理学家也能 Vibe 起来!"——但 Vibe Physics 的核心不是工具,是 Lupsasca 这种 New Horizons 奖得主级别的领域判断力。
AI 产品取代不了这一层。
如果剥掉名字、剥掉媒体包装,Lupsasca-Strominger 那次到底干了什么?
5 个工程决策值得记下:
Lupsasca 没有把问题丢给 GPT-5.2 说"帮我解决黑洞振幅"。
他做的是:把团队过去一年研究方向、试过的方法、卡在哪、Strominger 的猜想结构——全部喂进上下文。把要计算的具体物理量、目标边界条件、希望的渐近行为——明确写出来。让 GPT-5.2 提建议而不是给答案。
这一步是上下文负载——前期工作占整体投入的 30%,但是后面 70% 收益的前提。
不是 prompt → answer 的单轮调用。
这是合作研究员模式,不是问答工具模式。
GPT-5.2 真正解决问题的方式不是把 32 项公式硬展开计算。
它建议——把这个问题看作 half-collinear regime 的极限情况。一个数学技巧,让原本爆炸的项数被压扁、相互抵消。
Lupsasca 自己说:"In retrospect, this looks natural. But it stumped domain experts for over a year."
这是 AI 真正给科研贡献的方式——不是"算得快",是"想到一个角度"。
graviton 跟 gluon 的对称性完全不同。直接复用 gluon 方法会得到错误结果。
GPT-5.2 在生成 graviton 解的过程中自己调整了方法——加入 graviton 特有的对称性约束,去掉 gluon 用过但 graviton 不适用的步骤。
一天 110 页新结果。这不是模板套话,是真在做物理。
Lupsasca 没有立刻发论文。他和团队花了 3 周逐项验证 AI 生成的所有计算:每一步代数、每个边界条件、跟已知理论的极限是否吻合。
外部团队(Cambridge 的 David Skinner)后来用 OpenAI 内部模型 SuperChat 跑了 12 小时独立证明,再人工通过——双重验证。
这 5 个决策合起来,就是 Vibe Physics 这个名字想指代的东西。
但请注意:5 个决策里,1、3、5 全靠 Lupsasca 是这个领域专家才走得通。
"我管它叫什么名字,能用就行。"
这种话在工程产品里 OK,在学术社区不 OK。学术社区里命名等于身份。
你说自己做 Vibe Physics 而你不是 Lupsasca,5 年内你会发现自己被排除在那个圈层之外,因为他们用这个词去筛人。
"取个名字而已,至于这么严肃吗?"
值得。看历史上几个例子:
命名一旦广传,原作者就管不住了。
Lupsasca 现在还有窗口期定义"Vibe Physics 是什么"。再过 6 个月就来不及了。
"这只是 OpenAI 的市场动作。"
部分对。Lupsasca 是 OpenAI 雇员,访谈在 OpenAI 自己的传播管道里走。
但即便如此,命名行为本身有学术意义——他在为一种实际存在的工作模式做术语化。这件事的功过要分开看:商业意图是真的,方法论价值也是真的。
我做 AI 产品的人,这次得到的体会是:新闻会过期,命名不会。
Lupsasca-Strominger 那篇 gluon 论文 3 个月前就发了。
现在还在被讨论的,不是论文里那个公式,是他给这种工作方式起了个名字。
12 个月后,没有人会记得 single-minus gluon tree amplitude 的具体形式。
但会有大量人在用"Vibe Physics"这个词——有人用对,有人用错,有人借势,有人误读。
我们做 AI Agent 产品的,多关注一些命名学的事。
你产品的功能可能 18 个月后被淘汰,但你给一种工作方式起的名字,可能成为这个领域的术语遗产。
最难的事不是用 GPT-5.2 推导一个 gluon 振幅。
是给一种工作模式起一个能传开、又不被歪曲的名字。
Lupsasca 在做后一件事。他能不能成功,目前看是 50/50——这个词的语义正在他给出的精确定义和大众想象的"轻松版 AI 写论文"之间撕扯。
往哪边倒,取决于接下来 12 个月有多少人愿意把它用对。
包括看到这篇文章的你。
资料来源: