Pathog-PDx: un sistema de aprendizaje automático para identificar 22 patógenos respiratorios pediátricos a partir del registro electrónico (Su 2026, npj Digital Medicine)

Dubin Su, Qun Chen, Ruizhi Xu y colegas, dirigidos desde el First Affiliated Hospital of Xiamen University (Wanshan Ning, coautor correspondiente) con coautores de Zhengzhou University, Nanjing University, Shenzhen Second People's Hospital y la University of Illinois Urbana-Champaign, publican el 29 de mayo de 2026 en npj Digital Medicine Pathog-PDx, un sistema de aprendizaje automático (machine learning: familia de técnicas en las que el modelo aprende una regla de decisión a partir de ejemplos etiquetados) que combina 42 variables clínicas y de laboratorio extraídas del registro electrónico para distinguir 22 subtipos de patógenos responsables de infecciones respiratorias en niños hospitalizados. Cohorte de desarrollo de 134.500 niños en tres centros clínicos y dos bases de datos, validación prospectiva independiente en 1.338 niños, AUC promedio (área bajo la curva ROC, métrica de discriminación entre casos positivos y negativos entre 0,5 y 1,0) de 0,88 sobre los 22 patógenos, 0,95 para el virus de la gripe con sensibilidad 0,88 y especificidad 0,86, manejo explícito de las coinfecciones, despliegue público de un sistema de apoyo a la decisión basado en web. Cuatro reservas, no obstante: todos los centros de desarrollo son chinos, el comparador clínico humano está ausente del resumen, la licencia CC BY-NC-ND cierra la adaptación académica, y el gold standard utilizado para etiquetar 22 clases merece una discusión aparte — biología molecular con precisión variable según el patógeno.

El contexto

Las infecciones respiratorias agudas son la principal causa de morbilidad pediátrica en el mundo y la segunda causa de mortalidad infantil por debajo de los cinco años según la OMS. Cuando ingresa un niño febril y sintomático, la decisión terapéutica depende del patógeno causal: antibiótico para Streptococcus pneumoniae o Mycoplasma pneumoniae, antiviral dirigido para el virus de la gripe o el SARS-CoV-2, soporte simple para el virus respiratorio sincitial (VRS) o un rinovirus banal. En la práctica el clínico decide antes de tener los resultados de los exámenes: la PCR multiplex y el cultivo tardan en general entre 6 y 48 horas en devolver un resultado operativo, mientras que la ventana de eficacia del oseltamivir contra la gripe se cierra idealmente en las primeras 48 horas. Es precisamente esa brecha entre decisión y diagnóstico a la que apunta Pathog-PDx.

Los enfoques previos se han centrado en uno o pocos patógenos — típicamente modelos binarios entrenados para reconocer bronquiolitis por VRS, neumonía neumocócica o Covid-19 — a partir de variables clínicas a pie de cama o imágenes radiológicas. El salto a 22 subtipos de patógenos simultáneamente, con manejo explícito de las coinfecciones (un mismo niño puede albergar a la vez dos o tres agentes), es en cambio muy reciente y todavía poco frecuente en la literatura publicada. La apuesta de Pathog-PDx es que una señal estable, multi-órgano, agregada desde el registro electrónico (EHR por electronic health record) — hemograma, marcadores inflamatorios, bioquímica básica, signos clínicos codificados, comorbilidades — porta suficiente información para preorientar el diagnóstico antes de que las pruebas microbiológicas específicas lo resuelvan.

El método

El estudio lo dirige Wanshan Ning (Institute for Clinical Medical Research, First Affiliated Hospital of Xiamen University), con coautores correspondientes Yungang Yang (Departamento de Pediatría, misma institución), Yaping Guo (Escuela de Ciencias Médicas Básicas, Zhengzhou University) y Jingjing Yang (Neumología y Cuidados Críticos, Xiamen). Los coautores comparten once afiliaciones, casi todas chinas (Xiamen, Nanjing, Zhengzhou, Shenzhen, Children's Hospital of Fudan University - sede Xiamen) más una afiliación en la Siebel School of Computing and Data Science de UIUC (Jiajun Fan). Publicado el 29 de mayo de 2026 en npj Digital Medicine, DOI 10.1038/s41746-026-02818-9, bajo licencia CC BY-NC-ND 4.0 (no comercial, sin obras derivadas) — punto al que volvemos. Financiación pública exclusivamente china (National Key R&D Program of China 2021ZD0201300 y 2022YFC2704300, NSFC 32400532 y 32570802, programas de Fujian, Henan y Xiamen). Los autores declaran no competing interests. El manuscrito se difunde en versión «no editada» (Article in Press), por tanto sujeto a modificación.

El sistema se llama Pathog-PDx (Pathogen Diagnostic System for Pediatric Respiratory Infections). Recibe como entrada 42 variables del registro electrónico — datos demográficos del niño, signos clínicos codificados al ingreso, antecedentes y comorbilidades, resultados del hemograma y bioquímica de rutina, marcadores inflamatorios (probablemente PCR y procalcitonina) — y produce a la salida una probabilidad para cada una de las 22 clases de patógenos más una probabilidad conjunta para las coinfecciones. Los autores reivindican una arquitectura interpretable: sin el manuscrito completo cabe suponer razonablemente un gradient boosting (XGBoost o LightGBM) acoplado a explicaciones por valores de Shapley (SHAP), patrón estándar para modelos tabulares en salud. Los comparadores citados son «modelos convencionales» — verosímilmente regresión logística multinomial, random forest y un baseline basado en reglas clínicas.

El conjunto de datos de desarrollo abarca 134.500 niños hospitalizados, agregados en tres centros clínicos chinos y dos bases de datos. El conjunto de validación prospectiva independiente cubre 1.338 niños de un cuarto centro — punto metodológico fuerte porque esa cohorte fue invisible para el modelo durante el entrenamiento y fue recogida tras congelar el modelo. El gold standard usado para etiquetar los 22 patógenos no se detalla en el resumen, pero combina verosímilmente, según la práctica china actual, PCR multiplex respiratoria, cultivo bacteriano y serología según el agente — una mezcla cuya sensibilidad analítica varía significativamente de un patógeno a otro.

Los resultados

En la cohorte de validación prospectiva, Pathog-PDx alcanza una AUC promedio de 0,88 sobre los 22 patógenos. Para el virus de la gripe tomado como ejemplo de aplicación clínica frecuente, la AUC es 0,95, la sensibilidad 0,88 y la especificidad 0,86. Los autores afirman que el modelo supera los enfoques convencionales tanto en infecciones simples como en coinfecciones — que constituyen la dificultad principal en pediatría, donde VRS y sobreinfección bacteriana coexisten con frecuencia. El sistema se desplegó como servicio web público en pathogpdx.zzu.edu.cn, alojado en servidores de Zhengzhou University, y proporciona para cada caso una predicción «antes de los resultados de las pruebas convencionales» con el objetivo explícito de preorientación terapéutica.

Traducción clínica. Para fijar las cifras sobre 1.000 niños ingresados con un síndrome respiratorio febril de los cuales unos 100 padecen realmente gripe (prevalencia típica en temporada epidémica en Asia Oriental): a las prestaciones anunciadas para la gripe, el modelo detectaría correctamente 88 de las 100 gripes verdaderas (12 falsos negativos), al precio de 126 falsos positivos de gripe entre las 900 no-gripes (sensibilidad 0,88, especificidad 0,86). En el conjunto de las 22 clases, una AUC promedio de 0,88 indica una discriminación global buena pero casi con seguridad oculta una variabilidad importante entre patógenos: los agentes raros o con firmas biológicas poco específicas (adenovirus, parainfluenza tipo 4, ciertos coronavirus estacionales) probablemente se clasifican peor que la gripe o el neumococo. Para un servicio de pediatría que gestiona una avalancha estacional, la herramienta no sustituye ni la PCR multiplex ni el juicio clínico, pero puede orientar de forma creíble la prescripción empírica de oseltamivir o la decisión de aislar respiratoriamente a un niño mientras se espera la confirmación biológica.

Lo que está bien

La validación prospectiva independiente existe de verdad, y eso es raro. La mayoría de los modelos clínicos de ML publicados en esta zona se contentan con una validación interna por validación cruzada o una validación retrospectiva sobre un sitio externo. Aquí, 1.338 niños se incluyeron de forma prospectiva en una cohorte específicamente constituida para evaluar el modelo tras su entrenamiento — el modelo tuvo que clasificar pacientes que nunca había visto, en un periodo posterior a la recogida de la cohorte de desarrollo. Es el procedimiento de evaluación más exigente antes de un ensayo controlado aleatorizado. A esto se suma el despliegue público de un servicio web funcional: la transposición «del papel al prototipo utilizable» se franquea concretamente, lo que sigue siendo minoritario en la literatura ML-salud.

La ambición multiclase con manejo de coinfecciones ataca un problema clínico real. Los modelos binarios «VRS sí/no» publicados en serie desde hace diez años no ayudan al clínico que debe jerarquizar el riesgo entre VRS, gripe, metapneumovirus, neumococo y Mycoplasma en el mismo niño. Un modelo que produce a la salida una probabilidad conjunta sobre 22 clases y que trata explícitamente las coinfecciones cambia la utilidad práctica: el clínico obtiene una tabla de probabilidades jerarquizadas que se corresponde con su forma real de razonar. Esta disciplina de etiquetado y evaluación multiclase es técnicamente más difícil que los enfoques binarios y merece reconocimiento.

Las variables de entrada están disponibles en todas partes. Las 42 variables que integra Pathog-PDx son datos rutinarios del registro electrónico: demografía, signos clínicos codificados, hemograma, PCR, bioquímica estándar. Ninguna requiere una imagen especializada, una biopsia o un panel molecular costoso. Esto significa que, sujeto a recalibración y revalidación externa, el modelo es en principio transponible a un hospital universitario europeo o norteamericano — incluso a centros con menos recursos que dispongan de un mínimo de exámenes biológicos estándar. La elección de variables es por tanto coherente con una ambición de generalización, aunque esa generalización quede por demostrar.

Lo que está menos bien

Todos los centros de desarrollo son chinos — sesgo de población evidente. Los tres centros clínicos y las dos bases de datos que aportan los 134.500 niños de entrenamiento son chinos (Xiamen, Zhengzhou, Shenzhen, Children's Hospital of Fudan University - sede Xiamen). La epidemiología respiratoria pediátrica varía sustancialmente de un continente a otro: la prevalencia de Mycoplasma pneumoniae conoció en China una ola excepcional en 2023-2024 que desplazó las distribuciones de clases, la proporción bacterias/virus depende de la cobertura vacunal (PCV13, triple vírica, antigripal) y por tanto del sistema sanitario, y ciertos patógenos endémicos regionales (típicamente metapneumovirus aviar o ciertos coronavirus estacionales) están sobrerrepresentados en algunos países. El modo de fallo aquí es el sesgo de población clásico: el modelo aprende una distribución condicional «signos clínicos + biología → patógeno» que no es universal. Demostrar que funciona en un niño febril de Marsella, Boston o Nairobi exigiría una validación externa no china — ausente aquí.

El comparador humano está ausente del resumen. Pathog-PDx se compara con «modelos convencionales» — verosímilmente regresión logística multinomial y random forest — a los que supera. La verdadera cuestión clínica es distinta: con las mismas 42 variables, ¿alcanza un pediatra senior de hospitalización una discriminación equivalente? ¿Un infectólogo pediátrico consultado además? Sin esa referencia humana, las cifras presentadas favorecen la herramienta frente a baselines algorítmicos, pero no permiten decidir si la preorientación por Pathog-PDx añade valor incremental sobre el juicio clínico habitual. Es el modo de fallo comparador sesgado por omisión: el baseline más pertinente — un clínico experimentado con los mismos datos — es invisible. A esto se suma el silencio del resumen sobre el rendimiento por clase: una AUC promedio de 0,88 sobre 22 patógenos implica casi mecánicamente que al menos algunos subtipos caen por debajo de 0,75, e identificar cuáles (probablemente los agentes raros o con firmas biológicas poco específicas) es decisivo para decidir en qué confiar en la práctica.

La licencia CC BY-NC-ND cierra la adaptación académica y saca a la luz una cuestión sobre el gold standard. El manuscrito se publica bajo CC BY-NC-ND 4.0 — no la CC BY 4.0 estándar de open access de Nature. El NC prohíbe todo uso comercial (legítimo); el ND prohíbe toda obra derivada, lo que complica la adaptación académica del código, los pesos o incluso las figuras para una réplica o transposición a otro contexto. A esto se añade una cuestión metodológica de fondo: el gold standard utilizado para etiquetar las 22 clases no se detalla en el resumen. Pero la sensibilidad analítica de una PCR multiplex respiratoria varía según el patógeno (excelente para la gripe, más débil para Mycoplasma), el cultivo bacteriano subestima sistemáticamente los agentes frágiles, y la serología tardía solo cubre retrospectivamente ciertos diagnósticos. Si algunas clases están etiquetadas con un estándar menos fiable, eso es ruido de etiqueta (label noise) inyectado en el entrenamiento, que puede degradar el rendimiento del agente afectado, o — peor — crear una ilusión de buena clasificación haciendo que el modelo aprenda la firma biológica del test en lugar de la del patógeno. Sin extraer estos detalles del manuscrito completo, el modo de fallo de shortcut learning queda por descartar formalmente.

Lo que esto cambia

Para la comunidad de investigación en IA-salud, Pathog-PDx se inscribe en una ola reciente de retorno a lo tabular para las cuestiones de diagnóstico diferencial, tras varios años de inversión masiva en imagen. El mérito está en empujar el estándar a 22 clases con coinfecciones: ya no basta con un benchmark binario VRS sí/no; ahora se exige una tabla jerarquizada de patógenos probables. Los grupos que trabajan en problemas vecinos — sepsis neonatal, sepsis en urgencias pediátricas, diagnóstico diferencial de meningitis — encontrarán aquí un patrón de pipeline (variables EHR de rutina, validación prospectiva en cohorte independiente, despliegue como servicio web) que pueden replicar. Queda por ver una réplica por un equipo europeo o norteamericano sobre sus propios datos, que dirá si la señal es portable o si era específica de la epidemiología respiratoria china del periodo de entrenamiento.

Para los pediatras clínicos, el uso inmediato creíble no es el reemplazo de la PCR multiplex sino la preorientación terapéutica en las primeras horas de hospitalización — el momento en que el clínico decide administrar o no oseltamivir, aislar o no a un niño con VRS, cubrir empíricamente o no una coinfección bacteriana. Una AUC de 0,95 sobre la gripe es una cifra creíble para ese caso de uso. En otras clases, sin el detalle por patógeno, la prudencia obliga a considerar Pathog-PDx como una ayuda a la hipótesis, no como un diagnóstico. Ningún sistema de este tipo está hoy aprobado por la Haute Autorité de Santé en Francia, ni con marcado CE como Software as a Medical Device, ni autorizado por la FDA en Estados Unidos. El uso clínico real fuera de China exigirá una revalidación local y una certificación regulatoria, que no son el objeto de este artículo.

Para los pacientes y sus familias, la enseñanza útil es que la identificación precoz del patógeno responsable de una bronquiolitis o una neumonía del niño se vuelve técnicamente más rápida gracias a modelos que explotan los análisis de rutina ya disponibles al ingreso. Esto no exime del recorrido clínico: un niño febril que empeora debe ser visto por un médico, y la decisión terapéutica sigue siendo humana. En espera de que una herramienta de este tipo sea validada y certificada para uso fuera de China, los buenos reflejos siguen siendo el uso prudente de los antibióticos (que no sirven contra los virus), la vacunación antigripal anual de los niños de riesgo, y la inmunización contra el VRS, ya recomendada en lactantes en varios países europeos.

Para profundizar

El artículo completo está en acceso libre en el sitio de npj Digital Medicine: nature.com/articles/s41746-026-02818-9. El sistema de apoyo a la decisión desplegado por los autores se puede consultar en pathogpdx.zzu.edu.cn (alojado en Zhengzhou University). Para el marco de la OMS sobre el manejo de las infecciones respiratorias en el niño: WHO Pocket Book of Hospital Care for Children. Para nuestra cobertura de otras aplicaciones del machine learning a la decisión médica desde el registro electrónico, véanse nuestro análisis del modelo SHAP-SVM de Zhou 2026 para la predicción de tromboembolia venosa en oncología y nuestro análisis del pipeline Brzus 2026 de neuroimagen pronóstica tras ictus.