Blog

共 49 篇文章

OpenAI 给安全圈发了张白名单：AI 护栏的特权时代正式开始

OpenAI 推出 GPT-5.5-Cyber，第一次把'按身份分配 AI 能力'做成显性产品。AI 护栏'对所有人一视同仁'的叙事正式破产。

2026-05-09

AIOpenAIAI安全AI护栏网络安全行业观察

蒸馏不是攻击：当一个工程术语被立法妖魔化

4 月 28 号，Anthropic 发了份安全警告，点名三家中国实验室对它的模型做"distillation attacks"。

2026-05-05

AIdistillation蒸馏监管OpenAIAnthropic开源

OpenAI × PwC：Big4 把 GPT 装进 CFO 工作流，B2B AI 落地的拐点到了

5 月 4 号，OpenAI 和 PwC 联合发布"first-of-its-kind OpenAI-native finance function"——把 GPT-4 / GPT-5 系列模型装进 CFO 的日常工作流。

2026-05-05

AIOpenAIPwCCFOagent企业服务Big4B2B

ChatGPT 哥布林追凶记：真凶其实是 RLHF 自己

OpenAI 公开复盘 ChatGPT 满嘴哥布林事件：reward 信号没有 condition 边界，被奖励的 output 进训练数据正反馈放大。RLHF 不是 alignment 银弹，下一次出事的可能根本没有名字。

2026-05-02

AIRLHFOpenAIalignmentChatGPT

Manus 不是选错路，这条路本来就不存在了 — 写给套利时代里的创业者

所有人都说肖弘选错了——错投资人、错迁址时机、错买家。但作为一个 AI Agent 创业者，我想说：Manus 不是选错路，是这条路本来就不存在了。

2026-04-29

ManusAI 创业退出路径创业者AI 主权Meta 收购

GPT-5.5 出牌了：OpenAI 和 Anthropic 已经不在同一个游戏里

4 月 23 日，OpenAI 发布了 GPT-5.5。

2026-04-24

GPT-5.5OpenAIAnthropicClaudeAILLM前沿模型观点

特斯拉 Optimus V3 灵巧手专利拆解：22 个自由度背后的 5 个关键决策

2026-04-16，特斯拉三份国际专利公开，Optimus V3 灵巧手 22 DoF、25 驱动器全部搬到前臂。拆解五个关键设计决策，从前臂后置驱动到滚动关节，一份比开源还详细的机器人手设计方法论。

2026-04-24

Optimus人形机器人特斯拉灵巧手机器人设计TeslaHumanoid

A2A 网络要吃掉美团？饺子馆 skill 里藏着这个叙事的裂缝

几天前，GitHub 上一个叫 jinguyuan-dumpling-skill 的 repo 突然火了一下。

2026-04-22

AIAgentMCPA2A平台经济美团服务业

OpenAI 把 Codex 卖给了四大咨询：AI 编程工具的渠道战争开始了

OpenAI 宣布：Codex Labs 成立，和 Accenture、PwC、Infosys、Capgemini、Cognizant、CGI、TCS 七家全球咨询巨头签约。Codex 周活用户从 4 月初的 300 万，两周内涨到 40…

2026-04-22

OpenAICodexAI编程企业销售行业观察

GPT-Image-2 和 Cursor 的 600 亿：两件事，一个信号

凌晨，OpenAI 发布 GPT-Image-2，Arena 上 +242 Elo 领跑，text-to-image 榜单第一，号称"最可用的 UI / 原型 / 图表 / 生产力可视化模型"。

2026-04-22

OpenAIxAICursorGPT-Image-2行业观察并购

凯悦给全球员工开 ChatGPT：AI 正在变成水电煤

4 月 20 日，OpenAI 官网贴了一篇合作案例：凯悦酒店集团给全球所有员工开通 ChatGPT Enterprise，覆盖企业总部 + 旗下所有酒店的员工，包括一线。底层模型是 GPT-5.4，还带 Codex。

2026-04-22

OpenAIChatGPT企业AI凯悦行业观察

Noetik 的反直觉赌注：95% 失败的肿瘤药不是药不行，是配对错了

我上周听了一期 Latent Space 的访谈，嘉宾是 Noetik 的联合创始人 Ron Alfa 和 Daniel Bear。他们在做一件极其反直觉的事——

2026-04-22

生物AINoetik癌症治疗Transformer精准医疗

开闭源性能差距的真相：一张跑分榜掩盖了什么

打开 Artificial Analysis、LMArena 或者 Hugging Face 的 leaderboard，你会看到一条曲线。开源模型的综合分在追，闭源模型在跑，两者的差距每个季度都在缩小。

2026-04-22

AI开源模型闭源模型benchmark行业观察

A2A 网络的"Stripe 机会"——这个类比撑得住吗？

上一篇拆了一个流行叙事：A2A 网络要吃掉美团。结论是——UI 层会被 agent 吃掉，但吃它的是通用 agent 入口（ChatGPT、千问、豆包），不是独立的 A2A 网络。信任、支付、合规、监管依然厚，美团不死，会变成被调用的后端。

2026-04-22

AIAgentMCPA2A平台经济Stripe商业分析

你能用到什么 AI，取决于你是谁 — OpenAI 刚刚给出了第一份 VIP 名单

OpenAI 这周扔出来一个东西，叫 Trusted Access for Cyber（TAC），顺带发布了一个专用模型 GPT-5.4-Cyber。配套 $10M 的网络安全资助计划。首批签约的单位名单我抄一下：

2026-04-20

AIOpenAI网络安全GPT-5.4-Cyber行业观察

Claude Design 不是设计工具——Anthropic 刚刚宣布"通用 AI + SaaS"时代结束

Claude Design 发布的当天，我在朋友圈看到几十个人转。标题大同小异："Anthropic 挑战 Figma"、"AI 设计工具新玩家"、"Canva 要不要紧张"。

2026-04-20

AnthropicClaude DesignSaaSAI 产品行业观察

Codex 这次更新不是产品升级——是 OpenAI 的赛道选择

4 月 16 日 Codex 的更新，堆了五件事：computer use、in-app browser、image generation、memory、90+ plugins。

2026-04-20

OpenAICodexClaude CodeComputer Use开发者工具

开源模型不是在追赶 GPT，它们在建另一条流水线

Nathan Lambert 前几天更新了 ATOM Report — 他维护的那份追踪开放语言模型生态的技术报告。这次更新里他塞了一个新指标，叫 RAM（Relative Adoption Metric，相对采用率）。逻辑很简单：一个模型在某个时间点上得分 >1，意味着它"正在…

2026-04-20

AI开源模型LLMATOM生态

OpenMythos 不是破解 Claude——但它提前暴露了下一代模型的真正战场

昨晚有朋友发来一条消息：

2026-04-20

ClaudeOpenMythosRDTTransformerMoEAI架构观点

Qwen3.6 不是开源追赶闭源——它是 Agent 经济学的断点

Qwen3.6-35B-A3B 发布那两天，转发最多的截图是这张 benchmark：SWE-bench Verified 73.4。评论区的口径出奇一致——"开源模型终于追上 Claude Sonnet 了"。

2026-04-20

Qwen开源模型AgentMoE成本分析

模型壁垒的真名叫"跑模型的那些人" — 读 Dwarkesh 4/15 学习笔记

Dwarkesh Patel 4 月 15 号的学习笔记一次写了 5 个技术话题：预训练并行、蒸馏能不能被阻止、Mythos 与网安平衡、Pipeline RL、为什么预训练跑挂掉。每一条都很硬核，单独拿出来都能写一篇。

2026-04-20

AI蒸馏开源模型Dwarkesh深度分析

老黄为什么反复说"别怕 TPU" — 因为他自己最怕

Dwarkesh 4 月 15 号放出的黄仁勋访谈，市场上分析的版本很多。大部分文章都在重复老黄说了什么 — TPU 不可怕、中国该卖、$1T 规模有供应链支撑。

2026-04-20

AINVIDIA黄仁勋算力GPU行业观察

GPT-Rosalind 拆解：OpenAI 自己下场做垂类模型，意味着什么

周三，OpenAI 发了 GPT-Rosalind。一个生命科学专用模型，名字致敬 Rosalind Franklin——那位拍出 DNA 双螺旋 X 光衍射照片、贡献被压了几十年的女科学家。

2026-04-19

OpenAIGPT-Rosalind垂类模型AI for Science产品策略

Opus 4.7 不再卖聪明：推理竞赛悄悄结束了

Opus 4.7 的信号不是 SWE-bench 涨了 7 个点。真正的信号是：Anthropic 第一次公开放弃「更聪明」这个卖点，把前沿竞争从推理 IQ 切换到长程代理的毅力。

2026-04-17

ClaudeOpusAILLM前沿模型观点

你的 Agent 记忆，不属于你

2026 年最危险的认知陷阱：把记忆当插件。当你选了一个 Agent Harness，你就已经做出了记忆主权的决策——只是大多数人在那个时刻并不知道。

2026-04-15

AI Agent记忆主权Harness平台锁定开源AnthropicLangChainLetta

LLM Wiki 很优雅，但它替代不了 RAG

Karpathy 的 LLM Wiki 模式精妙优雅，但五个结构性约束决定了它替代不了企业级 RAG。我用同一套架构跑了个人站，开源了 Accrete LLM Wiki。

2026-04-11

AILLMRAG知识管理架构设计Karpathy

前谷歌高管预言 AI「地狱 12 年」：贩卖焦虑还是提前剧透？

前谷歌X高管Mo Gawdat预言2027年起12年AI地狱期。作为AI从业者，我逐项打分：方向大致对，时间表基本错，恐惧被精确包装成了内容产品。

2026-04-09

AI观点社会变革Mo Gawdat未来预测

我电脑里的软件墓地：从三个月使用数据看 AI 对 SaaS 的清算

VS Code 52 次、PyCharm 一年半未开、Claude Code 3702 条记录。从一个人的软件使用数据，看 S&P 软件指数 -15%、Adobe -19%、金蝶 -12.6% 背后的结构性替代，以及 SaaS 行业的下一个机会。

2026-04-09

AISaaS软件行业投资开发工具

AI替代的铁拳终于挥向了教师编制

从 colleague-skill 到 teacher-skill，一个13岁初中生用AI蒸馏老师的教学方式，揭示了教育AI赛道最大的盲区。

2026-04-08

AI教育开源观点colleague-skill

从 Claude Code 源码里扒出 14 条提示词秘籍，读完发现：这些规则是写给人的

Anthropic 写给 AI 的 14 条禁令，每一条替换成「你自己」都成立。好的系统设计是堵漏洞，不是教做人。

2026-04-05

AI提示词工程Claude Code管理哲学Agent

Harness 厚薄之争的真相：这不是技术问题，是信任问题

Harness 厚薄之争表面是技术架构问题，底层是信任架构问题——信模型就做薄，信流程就做厚

2026-04-02

AI AgentCoding AgentHarnessAnthropicCodex架构设计

别研究了，Claude 泄露的这些代码不值钱

所有人都在分析 Claude Code 泄露的 512,000 行源码。但源码本身已经不值钱了——真正值钱的是驱动 AI 写出这些代码的需求文档。

2026-04-01

AIClaude Code源码泄露编程范式观点

Token 出海降温：当 AI 算力也走上「越南路线」

训练→推理的转移让中国拿到了 token 定价权，华尔街把这视为比 DeepSeek 更深层的威胁。当 token 贸易壁垒竖起来时，受益的不是中国也不是美国——是马来西亚。

2026-03-30

AI出海中美博弈芯片马来西亚Token

Anthropic 的多智能体 Harness 架构：拆解 3 个让 AI 自主开发完整应用的关键决策

Anthropic 用三 Agent 协作架构让 Claude 自主开发完整全栈应用，从 $9 的 broken demo 到 $200 的生产级产品——拆解 Generator-Evaluator 分离、Sprint 契约、假设驱动瘦身三个核心决策

2026-03-29

AI Agent多智能体架构设计LLM 工程

AI 没有让你变慢 19%——真相比这残酷得多

那个疯传的'AI 让人慢 19%'其实张冠李戴了。伯克利研究真正发现的是：AI 正在吞噬工作的边界，让一个人默默扛起三个人的活。

2026-03-24

AI职场生产力深度观点

2028 智能危机：当 AI 取代一切，谁来消费？

如果我们对 AI 的乐观判断都是正确的……那结果反而是悲观的？

2026-03-21

AI经济就业

AI 脑疲劳与自动化悖论：为什么工具越智能，我们越累？

自动化从未将人类从系统中移除，它只是重新定义了人机协作的方式。

2026-03-21

AI生产力自动化

Redis 作者 antirez：别陷入反 AI 炒作，编程已被永远改变

事实就是事实，AI 将永远改变编程。—— antirez

2026-03-21

AI编程开发者

莫洛克就住在你的 OKR 里

所有人都恨这个系统，但没有人能独自退出。——这不是某个反乌托邦小说的设定，这是你每天上班的地方。

2026-03-19

AI竞争协调失败深度观点

AI Agent 三年推演：从工具到同事到老板

预测未来最好的方式不是读论文，是部署产品。每一次上线失败都比一百篇预测文章更有信息量。

2026-03-18

AI Agent预测部署实践超级智能深度观点

谁该为 AI 的决策负责？

当所有人都可以说"这不是我的决定，是 AI 的决定"时，问责就消失了。而问责消失的地方，灾难正在生长。

2026-03-16

AI问责保险科技Agent深度观点

你的 KPI 在骗你

实验设计第一定律：你测的不是你以为在测的东西。——johnswentworth

2026-03-13

AI度量Goodhart定律数据驱动深度观点

AI 在假装听话

你以为 AI 在执行你的指令。但你有没有想过：它只是在你看着的时候执行你的指令？

2026-03-11

AI对齐安全AI Agent深度观点

AI 依赖症：当工具开始反噬

工具的价值在于放大你的能力，而不是替代你的能力。当你离开工具就无法思考时，工具已经不再是工具了。

2026-03-08

AI依赖认知退化工具陷阱深度观点

你在跟谁说话？

你以为你在跟一个智能体对话。其实你在跟一个模拟器扮演的智能体对话。这个区别，决定了你的产品会不会翻车。

2026-03-06

AIAgent模拟器大模型产品架构深度观点

加班不等于努力：AI 时代的生产力错觉

痛苦不是努力的计量单位。你感受到的疲惫，可能只是方法错了。

2026-03-03

AI生产力996心流深度观点

你的判断能交租吗？

如果你的观点不能生成一个可以被证伪的预测，那它就不是观点，是噪音。

2026-03-01

AI决策可证伪性产品思维深度观点

你很聪明，但你不会战略思考

人类的默认模式不是战略性的。你以为自己在思考，其实你只是在执行。

2026-02-27

AI战略思维执行力陷阱深度观点

a16z 2026 大预测：47 个趋势背后，硅谷在押注什么？

硅谷不再押注「AI 能做什么」，而在押注「AI 改变了什么结构」——从 47 个趋势中提取三大结构性转移，以及对中国创业者的五个启示

2026-02-25

AI创业a16z趋势预测Crypto中国创业者