Mirai在"安全网"医院乳腺X线摄影中的应用:AI风险分层前瞻性部署带来什么改变
UCSF团队于2026年5月18日在npj Digital Medicine上发表了对Mirai的首个前瞻性部署评估——这是一个基于乳腺X线摄影预测一年期乳腺癌风险的AI模型——研究地点为一家美国"安全网"公立医院。在4,145次筛查性乳腺X线摄影中,算法将525名患者标记为高风险,其中100人接受了加急流程,使从筛查到判读的时间缩短99%,到活检的时间缩短87%。这是一项真实的临床工作流研究,因其研究场景和审慎的结论而具有价值,但应将其视为运营层面的演示,而非对算法本身的诊断验证。
背景
筛查性乳腺X线摄影依赖一条脆弱的物流链:图像于某天采集,由放射科医生在第二天或下一周判读,结果通知患者,患者随后需要预约二线诊断检查(超声、补充投照位,有时是MRI),最后如有需要再做活检。在资源充足的中心,这一流程需要几天到三周。而在所谓的安全网医院——为美国无保险或保险不足人群服务的机构——这一流程需要数周乃至数月,部分患者会在过程中流失。这种流失是美国乳腺癌死亡率不平等的公认因素之一,尤其在非裔美国女性中。
从乳腺X线摄影估计个体乳腺癌风险的AI模型自2021年起已趋于成熟。Mirai由Adam Yala及其同事在MIT、后在UCSF发表,预测患者在筛查后一至五年内罹患乳腺癌的概率。该模型已在来自美国、欧洲和亚洲的逾20万次检查上完成验证,一年期AUC(ROC曲线下面积,衡量区分阳性与阴性的能力——1为完美,0.5为随机)在不同队列中约为0.75–0.80。悬而未决的问题不再是Mirai在数据集上是否有效,而是当它被整合到真实临床流程、真实医院和真实患者中时会发生什么。
方法
研究在Zuckerberg San Francisco General Hospital的Avon Breast Center进行,这是一家旧金山的公立医院,主要服务对象为无保险、Medi-Cal参保或近期移民的患者。研究经IRB批准,符合HIPAA,采用对照但非随机化的设计。
流程如下。一次筛查性乳腺X线摄影被采集并实时传输至本地部署的Mirai实例。模型计算出一年期风险评分。如果患者落入风险的顶部10%(top 10%),系统将她标记为高风险。在入组日(研究期间每周两到三天),协调员会告知被标记的患者,她们可以原地等待放射科医生的即时判读,并在影像提示异常时,于当日完成补充诊断评估(补充投照、定向超声),必要时安排短期内的活检。
非入组日作为对照组:Mirai判定为高风险的患者按常规流程走——即数周的标准等待。这是一个有意义的对照,因为它避免了AI安慰剂效应:对照组同样是高风险,只是没有被优先处理。
在研究期内,Mirai共处理了4,145次筛查性乳腺X线摄影,525名女性(12.7%)落入top 10%风险区。入组日内,100人接受了加急路径,构成实验队列。其他日子的对应高风险患者作为对照。
结果
在加急路径的100名患者中,94%在当日获得乳腺X线摄影的即时判读,26人需要并接受了当日的补充诊断评估。最显著的数字是时间相关指标。
在筛查中检出癌症的患者中(实验组6例,对照组样本量相当),从筛查到结果通知的时间从数周降至几小时——缩短99.1%。到补充诊断评估的时间同样下降99.1%。到活检的时间缩短87.2%。
癌症检出率方面,加急队列为每千人筛查中检出60例癌症,而未被Mirai标记为高风险的女性中为每千人2.3例。这一差异并非传统意义上对模型性能的衡量——它在机制上是选择的产物(Mirai将癌症集中于top 10%)。但它确认了定位的有效性:在现场,算法确实分离出富含真实癌症的人群。
从临床转化角度看:在Zuckerberg San Francisco General每筛查一千名患者中,约23人在Mirai顶部十分位中携带癌症。加急路径将这23例癌症的完整诊断从数周缩短到数小时,活检环节从一两个月缩短到几天。这是物流层面的改进,而非在同样人群中检出绝对癌症数的变化。
优点
三项具体优势。
研究场景选择非常恰当。美国的安全网医院是诊断可及性不平等最严重的机构。AI放射学文献的相当一部分产生于Stanford、MIT或Mayo Clinic——资源丰富且高度数字化的中心,那里的时间本来就很短。在一个城市公立医院、面对以非白人和经济脆弱人群为主的群体证明Mirai整合有效,能有效地推动讨论的边界。
对照设计是诚实的。对照组患者同样被Mirai标记为高风险——差异不在模型性能本身,而在优先处理的流程是否启动。这避免了部署文献中常见的对照偏倚陷阱(用"AI+流程"对比"无AI且无流程")。
Mirai的代码自2021年起以MIT许可证公开(github.com/yala/Mirai),本研究使用团队自行掌控的本地部署,而非专有黑盒API。这种透明性让其他安全网体系可以尝试类似整合,而无需依赖商业供应商。
不足
三项明确的局限。
实验样本量非常小。100名患者接受加急路径,实际筛查检出癌症的仅6例。所有的时间缩短百分比(99.1%、87.2%)都建立在这一小样本之上。可获得的摘要未报告置信区间。在仅6例的情况下,一个偏离均值的异常延迟即可显著改变平均值——这是经典的误导性指标陷阱。效应方向可信,确切幅度则远不那么可靠。
研究不是随机化的。"入组日"与"非入组日"的对比对日历偏倚敏感(可用人员配置、周二与周四就诊患者类型差异等)。要从因果上得出加急路径缩短延迟的结论,需要按患者随机化的试验——作者并未如此主张,但媒体可能会过度宣传。即使两组都来自同一Mirai顶部十分位,组间人群偏倚的风险依然真实。
值得注意的利益冲突。Maggie Chung与Adam Yala持有Voio Inc.的股份,这是Adam Yala共同创立的AI医疗公司。作者声明没有"与本研究相关"的财务或非财务利益冲突,但Mirai是Adam Yala的历史代表产品,其临床效用的展示会直接影响公司估值。这并不否定研究——该研究仍属学术性质,由NIH与Breast Cancer Research Foundation资助——但在推广之前,由无商业利益的独立团队进行复现将非常有价值。
补充说明:2026年5月18日发布的版本是早期访问的未编辑版本,最终正式发表前还会经过编辑流程,部分数据可能有细微调整。
带来的改变
对研究界而言,这是一个有意义的方法学信号。乳腺X线风险模型的回顾性评估文献已很丰富;真正的前瞻性部署仍然稀少,安全网场景下的部署更是凤毛麟角。论文提供了一个可复用的协议蓝本——实时整合、信息系统标记、专属流程——供其他团队借鉴。
对临床放射科医生与诊疗协调员而言,启示不在于Mirai提升了诊断本身,而在于基于AI评分的自动优先级排序能够重组就诊队列。增值是物流层面的。本就高效的中心(筛查到活检不到七天)从中获益有限;而那些延迟超过一个月的中心,则可在拥有人力资源吸收即时判读的前提下加以借鉴。
对患者与公众而言,需传达的信息是审慎的。Mirai在本研究中并未在绝对数量上检出更多癌症;它的作用是让人更早知道自己患癌——在那些"更晚"意味着失去机会的人群中。这是一种不那么炫目的AI医疗用法,但短期内可能比许多AUC刷榜的演示更具实际影响。
延伸阅读
论文以CC BY 4.0开放获取方式发表在npj Digital Medicine官网,DOI为10.1038/s41746-026-02743-x。Mirai源代码在GitHub上以MIT许可证发布,模型权重在学术许可下分发。Mirai原始论文及多中心验证见Yala等,Science Translational Medicine,2021(DOI 10.1126/scitranslmed.aba4373)。关于美国乳腺X线风险模型作为软件医疗器械(SaMD)的监管背景,参见FDA公布的AI/ML-Enabled Medical Devices清单。