Mirai en mamografía en un hospital safety-net: lo que cambia un despliegue prospectivo de la estratificación de riesgo por IA
Un equipo de UCSF publicó el 18 de mayo de 2026 en npj Digital Medicine la primera evaluación prospectiva de un despliegue de Mirai —modelo de IA que predice el riesgo de cáncer de mama a un año a partir de mamografías— en un hospital de red de seguridad en Estados Unidos. Sobre 4.145 mamografías de cribado, 525 pacientes fueron señaladas como de alto riesgo por el algoritmo, y 100 aceptaron un circuito acelerado que redujo en un 99 % el tiempo entre cribado e interpretación, y en un 87 % el tiempo hasta la biopsia. Es un estudio real de flujo clínico, valioso por su contexto y por la modestia de sus afirmaciones, pero debe leerse por lo que es: una demostración operativa, no una validación diagnóstica del algoritmo.
El contexto
La mamografía de cribado se apoya en una cadena logística frágil. La imagen se adquiere un día, la lee un radiólogo al siguiente o a la semana siguiente, el resultado se notifica a la paciente, quien debe agendar después una evaluación diagnóstica de segunda línea (ecografía, vistas complementarias, a veces resonancia magnética), y finalmente una biopsia si procede. En centros bien dotados, este recorrido toma de unos días a tres semanas. En los hospitales llamados safety-net —que atienden a poblaciones no aseguradas o subaseguradas en Estados Unidos— toma semanas, a veces meses, y parte de las pacientes se pierde en el camino. Esta pérdida es uno de los factores reconocidos de las desigualdades de mortalidad por cáncer de mama, en particular entre mujeres negras estadounidenses.
Los modelos de IA capaces de estimar el riesgo individual de cáncer de mama a partir de mamografía están maduros desde 2021. Mirai, publicado por Adam Yala y colegas en MIT y luego UCSF, predice la probabilidad de que una paciente desarrolle cáncer de mama en los uno a cinco años siguientes a una mamografía de cribado. Ha sido validado sobre más de 200.000 exámenes de centros americanos, europeos y asiáticos, con un AUC a un año (área bajo la curva ROC, que mide la capacidad de separar un caso positivo de un negativo — 1 es perfecto, 0,5 es azar) en torno a 0,75–0,80 según las cohortes. La pregunta abierta ya no era si Mirai "funciona" sobre datasets, sino qué ocurre al integrarlo en un flujo clínico real, en un hospital real, con pacientes reales.
El método
El estudio se realiza en el Avon Breast Center del Zuckerberg San Francisco General Hospital, hospital público de San Francisco que atiende mayoritariamente a pacientes no aseguradas, en Medi-Cal o recientemente inmigradas. Protocolo aprobado por el IRB, conforme con HIPAA, diseño controlado pero no aleatorizado.
El circuito funciona así. Se adquiere una mamografía de cribado y se transmite en tiempo real a una instancia local de Mirai. El modelo calcula una puntuación de riesgo a un año. Si la paciente cae en el decil superior (top 10 %), se la marca como de alto riesgo en el sistema de información. En los días de inclusión (dos a tres días por semana durante el periodo de estudio), un coordinador informa a las pacientes marcadas que pueden quedarse en el centro para una lectura inmediata por un radiólogo, y, si la imagen sugiere una anomalía, para una evaluación diagnóstica el mismo día (vistas complementarias, ecografía dirigida) y, si es necesario, una biopsia agendada a muy corto plazo.
Los días no de inclusión sirven como grupo control: las pacientes de alto riesgo según Mirai siguen el recorrido habitual —la espera estándar de varias semanas. Comparador interesante porque evita el efecto placebo de la IA: las controles también son de alto riesgo, simplemente no priorizadas.
Durante la ventana de estudio, Mirai procesó 4.145 mamografías de cribado. 525 mujeres (12,7 %) fueron marcadas en el decil superior. En días de inclusión, 100 aceptaron el circuito acelerado y forman la cohorte experimental. En los otros días, las pacientes de alto riesgo equivalentes funcionan como control.
Los resultados
De las 100 pacientes del circuito acelerado, el 94 % recibió una lectura inmediata de su mamografía el mismo día, y 26 requirieron (y recibieron) evaluación diagnóstica complementaria el mismo día. Las cifras destacadas son los tiempos.
Entre las pacientes con cáncer detectado en cribado (seis casos en el brazo experimental frente a controles de tamaño comparable), el tiempo entre cribado y entrega del resultado bajó de varias semanas a unas horas —una reducción del 99,1 %. El tiempo hasta la evaluación diagnóstica complementaria también cayó un 99,1 %. El tiempo hasta la biopsia diagnóstica se redujo un 87,2 %.
Sobre la tasa de detección de cáncer, la cohorte acelerada muestra 60 cánceres por 1.000 mujeres cribadas, frente a 2,3 por 1.000 entre las mujeres no marcadas como alto riesgo por Mirai. Esta diferencia no mide el rendimiento del modelo en el sentido clásico —es mecánicamente el producto de la selección (Mirai concentra los cánceres en el top 10 %). Pero confirma que la focalización funciona: en el terreno, el algoritmo aísla efectivamente una población enriquecida en cánceres reales.
En traducción clínica: por cada mil pacientes cribadas en Zuckerberg San Francisco General, unas 23 portan un cáncer en el decil superior de Mirai. El circuito acelerado reduce el diagnóstico completo de esos 23 cánceres de varias semanas a unas horas, y de uno o dos meses a unos días para la biopsia. Es una mejora logística, no un cambio en el número absoluto de cánceres detectados a igual población.
Lo bueno
Tres fortalezas específicas.
El terreno es exactamente el adecuado. Los hospitales safety-net son las instituciones donde las desigualdades de acceso al diagnóstico pesan más. Buena parte de la literatura IA-radiología se produce en Stanford, MIT o Mayo Clinic —centros ricos y digitalizados, donde los tiempos ya son cortos. Mostrar que una integración de Mirai funciona en un hospital público urbano, con población mayoritariamente no blanca y económicamente precaria, desplaza útilmente la conversación.
El comparador es honesto. Las pacientes control también están marcadas como alto riesgo por Mirai —la diferencia no es el rendimiento del modelo, sino la implantación de un flujo priorizado. Esto evita el clásico sesgo de comparador (comparar IA-más-flujo con ausencia-de-IA-y-de-flujo), frecuente en la literatura de despliegue.
El código de Mirai es público bajo licencia MIT desde 2021 (github.com/yala/Mirai), y el estudio usa un despliegue local controlado por el equipo —no una API propietaria opaca. Esta transparencia permite a otros sistemas safety-net intentar la misma integración sin depender de un proveedor comercial.
Lo menos bueno
Tres limitaciones precisas.
La muestra experimental es muy pequeña. 100 pacientes aceptan el circuito acelerado, 6 tienen efectivamente un cáncer detectado. Todos los porcentajes de reducción de tiempo (99,1 %, 87,2 %) descansan sobre estas cifras pequeñas. No se reportan intervalos de confianza en el resumen disponible. Con 6 casos, un único valor atípico cambia la media de forma considerable —la métrica engañosa clásica. La dirección del efecto es creíble, su magnitud exacta mucho menos.
El estudio no está aleatorizado. El contraste "días de inclusión" frente a "días no de inclusión" es vulnerable a sesgos de calendario (dotación de personal disponible, tipo de pacientes que acuden un martes frente a un jueves, etc.). Para concluir causalmente que el circuito acelerado reduce los tiempos haría falta un ensayo aleatorizado por paciente —algo que los autores no afirman, pero que la prensa podría sobrevender. El riesgo de sesgo de población entre brazos es real aunque ambas vengan del mismo decil superior de Mirai.
Conflicto de interés notable. Maggie Chung y Adam Yala tienen acciones en Voio Inc., empresa de IA en salud cofundada por Adam Yala. Los autores declaran que ningún vínculo financiero o no financiero es "relevant to this study", pero Mirai es el producto histórico de Adam Yala y la demostración de su utilidad clínica tiene un efecto directo sobre la valoración de la empresa. No descalifica —el estudio sigue siendo académico, financiado por NIH y la Breast Cancer Research Foundation— pero una replicación independiente por un equipo sin interés comercial sería valiosa antes de generalizar.
Nota adicional: la versión del 18 de mayo es una unedited version en acceso anticipado, que aún pasará por edición antes de la publicación final. Las cifras pueden evolucionar marginalmente.
Lo que cambia
Para la comunidad de investigación, es una señal metodológica útil. Las evaluaciones retrospectivas de modelos de riesgo mamográfico son abundantes; los despliegues prospectivos reales son raros, y los realizados en entornos safety-net aún más. El artículo aporta un esquema de protocolo —integración en tiempo real, marca en el sistema de información, circuito dedicado— reutilizable por otros equipos.
Para los radiólogos clínicos y coordinadores de cuidados, la lección no es que Mirai mejore el diagnóstico, sino que una priorización automática basada en una puntuación de IA permite reorganizar la cola de espera. El valor añadido es logístico. Los centros ya rápidos (menos de siete días del cribado a la biopsia) no extraerán mucho de esto; aquellos con demoras superiores a un mes podrían inspirarse, siempre que dispongan de recursos humanos para absorber las lecturas inmediatas.
Para las pacientes y el público, el mensaje es mesurado. Mirai no detecta más cánceres en términos absolutos en este estudio; sirve para saber antes que se tiene un cáncer, en una población para la que el "después" se traduce en pérdida de oportunidad. Es un uso poco glamoroso de la IA en salud, pero probablemente más impactante a corto plazo que muchas demostraciones de AUC batida.
Para profundizar
El artículo es de acceso abierto (CC BY 4.0) en el sitio de npj Digital Medicine, DOI 10.1038/s41746-026-02743-x. El código de Mirai está disponible en GitHub bajo licencia MIT, con los pesos del modelo distribuidos bajo licencia académica. Para la publicación original de Mirai y su validación multicéntrica, ver Yala et al., Science Translational Medicine, 2021 (DOI 10.1126/scitranslmed.aba4373). Para el contexto regulatorio estadounidense de los modelos de riesgo mamográfico como Software como Dispositivo Médico, ver la lista pública de la FDA de AI/ML-Enabled Medical Devices.