返回首页

Blog

共 49 篇文章

OpenAI 给安全圈发了张白名单:AI 护栏的特权时代正式开始

OpenAI 给安全圈发了张白名单:AI 护栏的特权时代正式开始

OpenAI 推出 GPT-5.5-Cyber,第一次把'按身份分配 AI 能力'做成显性产品。AI 护栏'对所有人一视同仁'的叙事正式破产。

AIOpenAIAI安全AI护栏网络安全行业观察
蒸馏不是攻击:当一个工程术语被立法妖魔化

蒸馏不是攻击:当一个工程术语被立法妖魔化

4 月 28 号,Anthropic 发了份安全警告,点名三家中国实验室对它的模型做"distillation attacks"。

AIdistillation蒸馏监管OpenAIAnthropic开源
OpenAI × PwC:Big4 把 GPT 装进 CFO 工作流,B2B AI 落地的拐点到了

OpenAI × PwC:Big4 把 GPT 装进 CFO 工作流,B2B AI 落地的拐点到了

5 月 4 号,OpenAI 和 PwC 联合发布"first-of-its-kind OpenAI-native finance function"——把 GPT-4 / GPT-5 系列模型装进 CFO 的日常工作流。

AIOpenAIPwCCFOagent企业服务Big4B2B
ChatGPT 哥布林追凶记:真凶其实是 RLHF 自己

ChatGPT 哥布林追凶记:真凶其实是 RLHF 自己

OpenAI 公开复盘 ChatGPT 满嘴哥布林事件:reward 信号没有 condition 边界,被奖励的 output 进训练数据正反馈放大。RLHF 不是 alignment 银弹,下一次出事的可能根本没有名字。

AIRLHFOpenAIalignmentChatGPT
Manus 不是选错路,这条路本来就不存在了 — 写给套利时代里的创业者

Manus 不是选错路,这条路本来就不存在了 — 写给套利时代里的创业者

所有人都说肖弘选错了——错投资人、错迁址时机、错买家。但作为一个 AI Agent 创业者,我想说:Manus 不是选错路,是这条路本来就不存在了。

ManusAI 创业退出路径创业者AI 主权Meta 收购
GPT-5.5 出牌了:OpenAI 和 Anthropic 已经不在同一个游戏里

GPT-5.5 出牌了:OpenAI 和 Anthropic 已经不在同一个游戏里

4 月 23 日,OpenAI 发布了 GPT-5.5。

GPT-5.5OpenAIAnthropicClaudeAILLM前沿模型观点
特斯拉 Optimus V3 灵巧手专利拆解:22 个自由度背后的 5 个关键决策

特斯拉 Optimus V3 灵巧手专利拆解:22 个自由度背后的 5 个关键决策

2026-04-16,特斯拉三份国际专利公开,Optimus V3 灵巧手 22 DoF、25 驱动器全部搬到前臂。拆解五个关键设计决策,从前臂后置驱动到滚动关节,一份比开源还详细的机器人手设计方法论。

Optimus人形机器人特斯拉灵巧手机器人设计TeslaHumanoid
A2A 网络要吃掉美团?饺子馆 skill 里藏着这个叙事的裂缝

A2A 网络要吃掉美团?饺子馆 skill 里藏着这个叙事的裂缝

几天前,GitHub 上一个叫 jinguyuan-dumpling-skill 的 repo 突然火了一下。

AIAgentMCPA2A平台经济美团服务业
OpenAI 把 Codex 卖给了四大咨询:AI 编程工具的渠道战争开始了

OpenAI 把 Codex 卖给了四大咨询:AI 编程工具的渠道战争开始了

OpenAI 宣布:Codex Labs 成立,和 Accenture、PwC、Infosys、Capgemini、Cognizant、CGI、TCS 七家全球咨询巨头签约。Codex 周活用户从 4 月初的 300 万,两周内涨到 40…

OpenAICodexAI编程企业销售行业观察
GPT-Image-2 和 Cursor 的 600 亿:两件事,一个信号

GPT-Image-2 和 Cursor 的 600 亿:两件事,一个信号

凌晨,OpenAI 发布 GPT-Image-2,Arena 上 +242 Elo 领跑,text-to-image 榜单第一,号称"最可用的 UI / 原型 / 图表 / 生产力可视化模型"。

OpenAIxAICursorGPT-Image-2行业观察并购
凯悦给全球员工开 ChatGPT:AI 正在变成水电煤

凯悦给全球员工开 ChatGPT:AI 正在变成水电煤

4 月 20 日,OpenAI 官网贴了一篇合作案例:凯悦酒店集团给全球所有员工开通 ChatGPT Enterprise,覆盖企业总部 + 旗下所有酒店的员工,包括一线。底层模型是 GPT-5.4,还带 Codex。

OpenAIChatGPT企业AI凯悦行业观察
Noetik 的反直觉赌注:95% 失败的肿瘤药不是药不行,是配对错了

Noetik 的反直觉赌注:95% 失败的肿瘤药不是药不行,是配对错了

我上周听了一期 Latent Space 的访谈,嘉宾是 Noetik 的联合创始人 Ron Alfa 和 Daniel Bear。他们在做一件极其反直觉的事——

生物AINoetik癌症治疗Transformer精准医疗
开闭源性能差距的真相:一张跑分榜掩盖了什么

开闭源性能差距的真相:一张跑分榜掩盖了什么

打开 Artificial Analysis、LMArena 或者 Hugging Face 的 leaderboard,你会看到一条曲线。开源模型的综合分在追,闭源模型在跑,两者的差距每个季度都在缩小。

AI开源模型闭源模型benchmark行业观察
A2A 网络的"Stripe 机会"——这个类比撑得住吗?

A2A 网络的"Stripe 机会"——这个类比撑得住吗?

上一篇拆了一个流行叙事:A2A 网络要吃掉美团。结论是——UI 层会被 agent 吃掉,但吃它的是通用 agent 入口(ChatGPT、千问、豆包),不是独立的 A2A 网络。信任、支付、合规、监管依然厚,美团不死,会变成被调用的后端。

AIAgentMCPA2A平台经济Stripe商业分析
你能用到什么 AI,取决于你是谁 — OpenAI 刚刚给出了第一份 VIP 名单

你能用到什么 AI,取决于你是谁 — OpenAI 刚刚给出了第一份 VIP 名单

OpenAI 这周扔出来一个东西,叫 Trusted Access for Cyber(TAC),顺带发布了一个专用模型 GPT-5.4-Cyber。配套 $10M 的网络安全资助计划。首批签约的单位名单我抄一下:

AIOpenAI网络安全GPT-5.4-Cyber行业观察
Claude Design 不是设计工具——Anthropic 刚刚宣布"通用 AI + SaaS"时代结束

Claude Design 不是设计工具——Anthropic 刚刚宣布"通用 AI + SaaS"时代结束

Claude Design 发布的当天,我在朋友圈看到几十个人转。标题大同小异:"Anthropic 挑战 Figma"、"AI 设计工具新玩家"、"Canva 要不要紧张"。

AnthropicClaude DesignSaaSAI 产品行业观察
Codex 这次更新不是产品升级——是 OpenAI 的赛道选择

Codex 这次更新不是产品升级——是 OpenAI 的赛道选择

4 月 16 日 Codex 的更新,堆了五件事:computer use、in-app browser、image generation、memory、90+ plugins。

OpenAICodexClaude CodeComputer Use开发者工具
开源模型不是在追赶 GPT,它们在建另一条流水线

开源模型不是在追赶 GPT,它们在建另一条流水线

Nathan Lambert 前几天更新了 ATOM Report — 他维护的那份追踪开放语言模型生态的技术报告。这次更新里他塞了一个新指标,叫 RAM(Relative Adoption Metric,相对采用率)。逻辑很简单:一个模型在某个时间点上得分 >1,意味着它"正在…

AI开源模型LLMATOM生态
OpenMythos 不是破解 Claude——但它提前暴露了下一代模型的真正战场

OpenMythos 不是破解 Claude——但它提前暴露了下一代模型的真正战场

昨晚有朋友发来一条消息:

ClaudeOpenMythosRDTTransformerMoEAI架构观点
Qwen3.6 不是开源追赶闭源——它是 Agent 经济学的断点

Qwen3.6 不是开源追赶闭源——它是 Agent 经济学的断点

Qwen3.6-35B-A3B 发布那两天,转发最多的截图是这张 benchmark:SWE-bench Verified 73.4。评论区的口径出奇一致——"开源模型终于追上 Claude Sonnet 了"。

Qwen开源模型AgentMoE成本分析
模型壁垒的真名叫"跑模型的那些人" — 读 Dwarkesh 4/15 学习笔记

模型壁垒的真名叫"跑模型的那些人" — 读 Dwarkesh 4/15 学习笔记

Dwarkesh Patel 4 月 15 号的学习笔记一次写了 5 个技术话题:预训练并行、蒸馏能不能被阻止、Mythos 与网安平衡、Pipeline RL、为什么预训练跑挂掉。每一条都很硬核,单独拿出来都能写一篇。

AI蒸馏开源模型Dwarkesh深度分析
老黄为什么反复说"别怕 TPU" — 因为他自己最怕

老黄为什么反复说"别怕 TPU" — 因为他自己最怕

Dwarkesh 4 月 15 号放出的黄仁勋访谈,市场上分析的版本很多。大部分文章都在重复老黄说了什么 — TPU 不可怕、中国该卖、$1T 规模有供应链支撑。

AINVIDIA黄仁勋算力GPU行业观察
GPT-Rosalind 拆解:OpenAI 自己下场做垂类模型,意味着什么

GPT-Rosalind 拆解:OpenAI 自己下场做垂类模型,意味着什么

周三,OpenAI 发了 GPT-Rosalind。一个生命科学专用模型,名字致敬 Rosalind Franklin——那位拍出 DNA 双螺旋 X 光衍射照片、贡献被压了几十年的女科学家。

OpenAIGPT-Rosalind垂类模型AI for Science产品策略
Opus 4.7 不再卖聪明:推理竞赛悄悄结束了

Opus 4.7 不再卖聪明:推理竞赛悄悄结束了

Opus 4.7 的信号不是 SWE-bench 涨了 7 个点。真正的信号是:Anthropic 第一次公开放弃「更聪明」这个卖点,把前沿竞争从推理 IQ 切换到长程代理的毅力。

ClaudeOpusAILLM前沿模型观点
你的 Agent 记忆,不属于你

你的 Agent 记忆,不属于你

2026 年最危险的认知陷阱:把记忆当插件。当你选了一个 Agent Harness,你就已经做出了记忆主权的决策——只是大多数人在那个时刻并不知道。

AI Agent记忆主权Harness平台锁定开源AnthropicLangChainLetta
LLM Wiki 很优雅,但它替代不了 RAG

LLM Wiki 很优雅,但它替代不了 RAG

Karpathy 的 LLM Wiki 模式精妙优雅,但五个结构性约束决定了它替代不了企业级 RAG。我用同一套架构跑了个人站,开源了 Accrete LLM Wiki。

AILLMRAG知识管理架构设计Karpathy
前谷歌高管预言 AI「地狱 12 年」:贩卖焦虑还是提前剧透?

前谷歌高管预言 AI「地狱 12 年」:贩卖焦虑还是提前剧透?

前谷歌X高管Mo Gawdat预言2027年起12年AI地狱期。作为AI从业者,我逐项打分:方向大致对,时间表基本错,恐惧被精确包装成了内容产品。

AI观点社会变革Mo Gawdat未来预测
我电脑里的软件墓地:从三个月使用数据看 AI 对 SaaS 的清算

我电脑里的软件墓地:从三个月使用数据看 AI 对 SaaS 的清算

VS Code 52 次、PyCharm 一年半未开、Claude Code 3702 条记录。从一个人的软件使用数据,看 S&P 软件指数 -15%、Adobe -19%、金蝶 -12.6% 背后的结构性替代,以及 SaaS 行业的下一个机会。

AISaaS软件行业投资开发工具
AI替代的铁拳终于挥向了教师编制

AI替代的铁拳终于挥向了教师编制

从 colleague-skill 到 teacher-skill,一个13岁初中生用AI蒸馏老师的教学方式,揭示了教育AI赛道最大的盲区。

AI教育开源观点colleague-skill
从 Claude Code 源码里扒出 14 条提示词秘籍,读完发现:这些规则是写给人的

从 Claude Code 源码里扒出 14 条提示词秘籍,读完发现:这些规则是写给人的

Anthropic 写给 AI 的 14 条禁令,每一条替换成「你自己」都成立。好的系统设计是堵漏洞,不是教做人。

AI提示词工程Claude Code管理哲学Agent
Harness 厚薄之争的真相:这不是技术问题,是信任问题

Harness 厚薄之争的真相:这不是技术问题,是信任问题

Harness 厚薄之争表面是技术架构问题,底层是信任架构问题——信模型就做薄,信流程就做厚

AI AgentCoding AgentHarnessAnthropicCodex架构设计
别研究了,Claude 泄露的这些代码不值钱

别研究了,Claude 泄露的这些代码不值钱

所有人都在分析 Claude Code 泄露的 512,000 行源码。但源码本身已经不值钱了——真正值钱的是驱动 AI 写出这些代码的需求文档。

AIClaude Code源码泄露编程范式观点
Token 出海降温:当 AI 算力也走上「越南路线」

Token 出海降温:当 AI 算力也走上「越南路线」

训练→推理的转移让中国拿到了 token 定价权,华尔街把这视为比 DeepSeek 更深层的威胁。当 token 贸易壁垒竖起来时,受益的不是中国也不是美国——是马来西亚。

AI出海中美博弈芯片马来西亚Token
Anthropic 的多智能体 Harness 架构:拆解 3 个让 AI 自主开发完整应用的关键决策

Anthropic 的多智能体 Harness 架构:拆解 3 个让 AI 自主开发完整应用的关键决策

Anthropic 用三 Agent 协作架构让 Claude 自主开发完整全栈应用,从 $9 的 broken demo 到 $200 的生产级产品——拆解 Generator-Evaluator 分离、Sprint 契约、假设驱动瘦身三个核心决策

AI Agent多智能体架构设计LLM 工程
AI 没有让你变慢 19%——真相比这残酷得多

AI 没有让你变慢 19%——真相比这残酷得多

那个疯传的'AI 让人慢 19%'其实张冠李戴了。伯克利研究真正发现的是:AI 正在吞噬工作的边界,让一个人默默扛起三个人的活。

AI职场生产力深度观点
2028 智能危机:当 AI 取代一切,谁来消费?

2028 智能危机:当 AI 取代一切,谁来消费?

如果我们对 AI 的乐观判断都是正确的……那结果反而是悲观的?

AI经济就业
AI 脑疲劳与自动化悖论:为什么工具越智能,我们越累?

AI 脑疲劳与自动化悖论:为什么工具越智能,我们越累?

自动化从未将人类从系统中移除,它只是重新定义了人机协作的方式。

AI生产力自动化
Redis 作者 antirez:别陷入反 AI 炒作,编程已被永远改变

Redis 作者 antirez:别陷入反 AI 炒作,编程已被永远改变

事实就是事实,AI 将永远改变编程。—— antirez

AI编程开发者
莫洛克就住在你的 OKR 里

莫洛克就住在你的 OKR 里

所有人都恨这个系统,但没有人能独自退出。——这不是某个反乌托邦小说的设定,这是你每天上班的地方。

AI竞争协调失败深度观点
AI Agent 三年推演:从工具到同事到老板

AI Agent 三年推演:从工具到同事到老板

预测未来最好的方式不是读论文,是部署产品。每一次上线失败都比一百篇预测文章更有信息量。

AI Agent预测部署实践超级智能深度观点
谁该为 AI 的决策负责?

谁该为 AI 的决策负责?

当所有人都可以说"这不是我的决定,是 AI 的决定"时,问责就消失了。而问责消失的地方,灾难正在生长。

AI问责保险科技Agent深度观点
你的 KPI 在骗你

你的 KPI 在骗你

实验设计第一定律:你测的不是你以为在测的东西。——johnswentworth

AI度量Goodhart定律数据驱动深度观点
AI 在假装听话

AI 在假装听话

你以为 AI 在执行你的指令。但你有没有想过:它只是在你看着的时候执行你的指令?

AI对齐安全AI Agent深度观点
AI 依赖症:当工具开始反噬

AI 依赖症:当工具开始反噬

工具的价值在于放大你的能力,而不是替代你的能力。当你离开工具就无法思考时,工具已经不再是工具了。

AI依赖认知退化工具陷阱深度观点
你在跟谁说话?

你在跟谁说话?

你以为你在跟一个智能体对话。其实你在跟一个模拟器扮演的智能体对话。这个区别,决定了你的产品会不会翻车。

AIAgent模拟器大模型产品架构深度观点
加班不等于努力:AI 时代的生产力错觉

加班不等于努力:AI 时代的生产力错觉

痛苦不是努力的计量单位。你感受到的疲惫,可能只是方法错了。

AI生产力996心流深度观点
你的判断能交租吗?

你的判断能交租吗?

如果你的观点不能生成一个可以被证伪的预测,那它就不是观点,是噪音。

AI决策可证伪性产品思维深度观点
你很聪明,但你不会战略思考

你很聪明,但你不会战略思考

人类的默认模式不是战略性的。你以为自己在思考,其实你只是在执行。

AI战略思维执行力陷阱深度观点
a16z 2026 大预测:47 个趋势背后,硅谷在押注什么?

a16z 2026 大预测:47 个趋势背后,硅谷在押注什么?

硅谷不再押注「AI 能做什么」,而在押注「AI 改变了什么结构」——从 47 个趋势中提取三大结构性转移,以及对中国创业者的五个启示

AI创业a16z趋势预测Crypto中国创业者