médical IA

Mirai在"安全网"医院乳腺X线摄影中的应用：AI风险分层前瞻性部署带来什么改变

发布于 2026年5月21日 · 9 分钟阅读

UCSF团队于2026年5月18日在npj Digital Medicine上发表了对Mirai的首个前瞻性部署评估——这是一个基于乳腺X线摄影预测一年期乳腺癌风险的AI模型——研究地点为一家美国"安全网"公立医院。在4,145次筛查性乳腺X线摄影中，算法将525名患者标记为高风险，其中100人接受了加急流程，使从筛查到判读的时间缩短99%，到活检的时间缩短87%。这是一项真实的临床工作流研究，因其研究场景和审慎的结论而具有价值，但应将其视为运营层面的演示，而非对算法本身的诊断验证。

背景

筛查性乳腺X线摄影依赖一条脆弱的物流链：图像于某天采集，由放射科医生在第二天或下一周判读，结果通知患者，患者随后需要预约二线诊断检查（超声、补充投照位，有时是MRI），最后如有需要再做活检。在资源充足的中心，这一流程需要几天到三周。而在所谓的安全网医院——为美国无保险或保险不足人群服务的机构——这一流程需要数周乃至数月，部分患者会在过程中流失。这种流失是美国乳腺癌死亡率不平等的公认因素之一，尤其在非裔美国女性中。

从乳腺X线摄影估计个体乳腺癌风险的AI模型自2021年起已趋于成熟。Mirai由Adam Yala及其同事在MIT、后在UCSF发表，预测患者在筛查后一至五年内罹患乳腺癌的概率。该模型已在来自美国、欧洲和亚洲的逾20万次检查上完成验证，一年期AUC（ROC曲线下面积，衡量区分阳性与阴性的能力——1为完美，0.5为随机）在不同队列中约为0.75–0.80。悬而未决的问题不再是Mirai在数据集上是否有效，而是当它被整合到真实临床流程、真实医院和真实患者中时会发生什么。

方法

研究在Zuckerberg San Francisco General Hospital的Avon Breast Center进行，这是一家旧金山的公立医院，主要服务对象为无保险、Medi-Cal参保或近期移民的患者。研究经IRB批准，符合HIPAA，采用对照但非随机化的设计。

流程如下。一次筛查性乳腺X线摄影被采集并实时传输至本地部署的Mirai实例。模型计算出一年期风险评分。如果患者落入风险的顶部10%（top 10%），系统将她标记为高风险。在入组日（研究期间每周两到三天），协调员会告知被标记的患者，她们可以原地等待放射科医生的即时判读，并在影像提示异常时，于当日完成补充诊断评估（补充投照、定向超声），必要时安排短期内的活检。

非入组日作为对照组：Mirai判定为高风险的患者按常规流程走——即数周的标准等待。这是一个有意义的对照，因为它避免了AI安慰剂效应：对照组同样是高风险，只是没有被优先处理。

在研究期内，Mirai共处理了4,145次筛查性乳腺X线摄影，525名女性（12.7%）落入top 10%风险区。入组日内，100人接受了加急路径，构成实验队列。其他日子的对应高风险患者作为对照。

结果

在加急路径的100名患者中，94%在当日获得乳腺X线摄影的即时判读，26人需要并接受了当日的补充诊断评估。最显著的数字是时间相关指标。

在筛查中检出癌症的患者中（实验组6例，对照组样本量相当），从筛查到结果通知的时间从数周降至几小时——缩短99.1%。到补充诊断评估的时间同样下降99.1%。到活检的时间缩短87.2%。

癌症检出率方面，加急队列为每千人筛查中检出60例癌症，而未被Mirai标记为高风险的女性中为每千人2.3例。这一差异并非传统意义上对模型性能的衡量——它在机制上是选择的产物（Mirai将癌症集中于top 10%）。但它确认了定位的有效性：在现场，算法确实分离出富含真实癌症的人群。

从临床转化角度看：在Zuckerberg San Francisco General每筛查一千名患者中，约23人在Mirai顶部十分位中携带癌症。加急路径将这23例癌症的完整诊断从数周缩短到数小时，活检环节从一两个月缩短到几天。这是物流层面的改进，而非在同样人群中检出绝对癌症数的变化。

优点

三项具体优势。

研究场景选择非常恰当。美国的安全网医院是诊断可及性不平等最严重的机构。AI放射学文献的相当一部分产生于Stanford、MIT或Mayo Clinic——资源丰富且高度数字化的中心，那里的时间本来就很短。在一个城市公立医院、面对以非白人和经济脆弱人群为主的群体证明Mirai整合有效，能有效地推动讨论的边界。

对照设计是诚实的。对照组患者同样被Mirai标记为高风险——差异不在模型性能本身，而在优先处理的流程是否启动。这避免了部署文献中常见的对照偏倚陷阱（用"AI+流程"对比"无AI且无流程"）。

Mirai的代码自2021年起以MIT许可证公开（github.com/yala/Mirai），本研究使用团队自行掌控的本地部署，而非专有黑盒API。这种透明性让其他安全网体系可以尝试类似整合，而无需依赖商业供应商。

不足

三项明确的局限。

实验样本量非常小。100名患者接受加急路径，实际筛查检出癌症的仅6例。所有的时间缩短百分比（99.1%、87.2%）都建立在这一小样本之上。可获得的摘要未报告置信区间。在仅6例的情况下，一个偏离均值的异常延迟即可显著改变平均值——这是经典的误导性指标陷阱。效应方向可信，确切幅度则远不那么可靠。

研究不是随机化的。"入组日"与"非入组日"的对比对日历偏倚敏感（可用人员配置、周二与周四就诊患者类型差异等）。要从因果上得出加急路径缩短延迟的结论，需要按患者随机化的试验——作者并未如此主张，但媒体可能会过度宣传。即使两组都来自同一Mirai顶部十分位，组间人群偏倚的风险依然真实。

值得注意的利益冲突。Maggie Chung与Adam Yala持有Voio Inc.的股份，这是Adam Yala共同创立的AI医疗公司。作者声明没有"与本研究相关"的财务或非财务利益冲突，但Mirai是Adam Yala的历史代表产品，其临床效用的展示会直接影响公司估值。这并不否定研究——该研究仍属学术性质，由NIH与Breast Cancer Research Foundation资助——但在推广之前，由无商业利益的独立团队进行复现将非常有价值。

补充说明：2026年5月18日发布的版本是早期访问的未编辑版本，最终正式发表前还会经过编辑流程，部分数据可能有细微调整。

带来的改变

对研究界而言，这是一个有意义的方法学信号。乳腺X线风险模型的回顾性评估文献已很丰富；真正的前瞻性部署仍然稀少，安全网场景下的部署更是凤毛麟角。论文提供了一个可复用的协议蓝本——实时整合、信息系统标记、专属流程——供其他团队借鉴。

对临床放射科医生与诊疗协调员而言，启示不在于Mirai提升了诊断本身，而在于基于AI评分的自动优先级排序能够重组就诊队列。增值是物流层面的。本就高效的中心（筛查到活检不到七天）从中获益有限；而那些延迟超过一个月的中心，则可在拥有人力资源吸收即时判读的前提下加以借鉴。

对患者与公众而言，需传达的信息是审慎的。Mirai在本研究中并未在绝对数量上检出更多癌症；它的作用是让人更早知道自己患癌——在那些"更晚"意味着失去机会的人群中。这是一种不那么炫目的AI医疗用法，但短期内可能比许多AUC刷榜的演示更具实际影响。

延伸阅读

论文以CC BY 4.0开放获取方式发表在npj Digital Medicine官网，DOI为10.1038/s41746-026-02743-x。Mirai源代码在GitHub上以MIT许可证发布，模型权重在学术许可下分发。Mirai原始论文及多中心验证见Yala等，Science Translational Medicine，2021（DOI 10.1126/scitranslmed.aba4373）。关于美国乳腺X线风险模型作为软件医疗器械（SaMD）的监管背景，参见FDA公布的AI/ML-Enabled Medical Devices清单。