返回博客

医学孤儿的出口

AI落地医疗AI罕见病OpenAI真实案例

上个月看到 OpenAI 发的那篇波士顿儿童医院案例,我以为又是一篇大医院配合大模型公司的公关稿。

划了几段。

没走。


有一类病叫罕见病。定义是发病率低于 1/2000。全球已知有 7000 多种,超过 3 亿人患病,其中大多数是孩子。

这类病有个说法叫"诊断漂流"——diagnostic odyssey,我不太喜欢这个词的翻译,"奥德赛"太浪漫了。实际上它的意思是:一个孩子带着一堆说不清的症状,被父母拉着从一家医院跑到另一家医院,从一个科室转到另一个科室,跑几年,跑十几年,没有人能告诉他们这孩子到底得了什么病。

EURORDIS 调查了 42 个国家的罕见病患者——平均确诊时间 4.7 年。其中 25% 的患者要等超过 8 年,看过的专科医生数量常常超过 8 位。

我想了一下这个"8 位医生"是什么感觉。不是一次看诊,是一次次把同一叠资料从包里掏出来,一次次从头解释"他 3 岁开始出现……",然后一次次等着看对方是不是这次能给出个答案。

这还是在能跑到医院的情况下。


波士顿儿童医院是美国顶尖的儿童医院之一。它有一个项目叫 Children's Rare Disease Collaborative,CRDC,专门接这类"漂流"进来的孩子。

CRDC 接到的患者,很多已经去过多家医院。来的时候带着厚厚一叠资料:基因检测报告、影像片子、从各地医生那里抄来的病历,和父母五年、十年的焦虑。

问题不在于没有数据。

是数据太多,太散,太专——一个基因科医生哪怕再厉害,人脑处理文献的速度是有限的。全球每年发表的基因研究数以万计,单基因遗传病相关的论文每年就有好几千篇。一个新发现的致病基因,可能三个月前才出现在某篇 Nature 子刊上。那个月刚好这位医生在带学生、在写申请书、在处理另一个紧急病例。

这不是哪个人的失职。这是一个知识量远超单人处理上限的结构性问题。

这就是他们找 OpenAI 的背景。


他们做的系统,医院自己叫它"co-pilot geneticist"——副驾驶遗传学家,大概是这么个意思。不是机器人医生,是坐在遗传学家旁边的那个助手,随时把病历、基因数据和全球医学文献整合进来,帮找方向。

技术上我没找到特别细的公开资料——OpenAI 的案例文章里说了方向,但没给实现细节。但原理不难猜:把患者表型(有哪些症状、体征)、基因组数据,跟现有文献里的基因-疾病关联做匹配,用大模型做综合推理,给出候选诊断方向。输出的不是"这孩子得了 X 病",是"你应该往这几个方向去找,优先级大概是这样的"。

不是一个按钮出答案的机器。

是帮医生在茫茫文献里找到那根细线。


到目前为止,这套系统帮助确诊了超过 40 例之前"被认为不可能诊断"的罕见病案例。

40 例,听起来不多。

但这 40 例,每一例背后可能是一个家庭漂流了五年、八年。

有没有具体的孩子姓名和病例细节?我没找到公开披露的资料——我不会编。这类案例涉及到真实的脆弱人群,病历本来就是极私密的东西,公开了什么、没公开什么,医院自有考量。OpenAI 的案例文章里写的是"此前没有答案的家庭",CRDC 的数据是"拿到基因诊断的患者里,70% 因此改变了治疗方案"。

70%。

我停了一下,想这个数字的意思——不是做了个检测,是本来治错方向的,或者完全没治可走的,确诊之后有了新的可能。


我平时怼的是那种"上面要 AI"的落地。

花几百万,KPI 完成了,患者感受没动。AI 当摆设,给汇报用的。这种我见过很多,没什么可写的。

波士顿儿童医院这件事,属于另一类。

难在哪?

罕见病诊断这件事,原来有一个结构性的坑:病足够少、够罕见,所以大部分医生一辈子也碰不到几例,经验没法积累。最新的基因研究日新月异,但临床一线的医生没时间跟踪。整个系统设计出来是为了处理常见病的,罕见病在里面是边角料。

AI 在这里干的活,不是替代遗传学家,是给遗传学家一个"能跟上文献速度的助手"。

这件事人做不到。不是能力问题,是人脑对信息的处理速度,跟每年几万篇文献的更新速度之间,存在一个物理意义上的差距。


我也不确定 40 例是不是终点。

OpenAI 通过 NextGenAI 项目往波士顿儿童医院投了 5000 万美元——含研究资助、算力和 API 资源。这个体量,肯定不是为了 40 个案例。

医院那边也有另一组数字:通过 50 多个自动化流程,节省了 6 万多个员工小时,折算大约 700 万美元的人力可以重新分配——供应链、手术排班、OR 利用率这类运营环节。

这两件事并排放在一起很有意思。

一件是救人,40 个家庭。一件是省钱,700 万美元。

ROI 报告里写的是后者。驱动这件事往下走的,可能也主要是后者。

但最后那 40 个诊断,是前者的事。


我想过这件事有没有问题。

有。

一个 AI 给出的候选诊断,后面还得遗传学家确认、做验证性检测、评估临床意义。不是出了答案就结束。错误的候选方向会把医生的注意力带跑。70% 改变了治疗方案,这个数字是好消息——但另一面是还有 30% 改变了什么都没有,或者还在等。

还有一个问题是:这套系统目前在顶尖研究型儿童医院里跑。去不了波士顿、去不了资源好的大城市的孩子——AI 帮不到他们。至少现在帮不到。

最先用上最好工具的,从来都是本来就资源最好的地方。这不是 AI 特有的问题,但 AI 不会自动改变它。

这件事和所有医疗技术进步一样,分配不均的问题会在一段时间内比技术本身更真实。


但我还是觉得这件事值得单独写一篇。

不是因为它神。

是因为这是我这几年看到的 AI 落地案例里,少见的一类——AI 做的事,是人在这件事上存在物理限制,不是懒,是真的做不到。

文献是真的读不完的。基因-疾病关联是真的追不上的。

我做 AI 产品的,平时接触的落地场景大部分是"让人更快做能做的事"。这件事不一样——它在处理的,是"人根本没有时间和容量做到的事"。

一个孩子在漂流七年之后,等来的不是"很遗憾我们尽力了",而是一个诊断——哪怕这个诊断是机器先找到的方向。

我读到这里,有点久没有的感觉。

不是"AI 改变世界"那种大词的感觉。

是——嗯,这个用对了。

这件事,这块地方,这个结构性的缺口,用对了。

至于之后会怎样,系统会扩到什么规模,还有多少孩子能用上它,多少用不上——

我不知道。

也许比我想的多。也许比我想的少。