Pathog-PDx : un système d'apprentissage automatique pour identifier 22 pathogènes respiratoires pédiatriques à partir du dossier électronique (Su 2026, npj Digital Medicine)
Dubin Su, Qun Chen, Ruizhi Xu et collègues, dirigés depuis le First Affiliated Hospital of Xiamen University (Wanshan Ning, co-auteur correspondant) avec des co-auteurs de Zhengzhou University, Nanjing University, Shenzhen Second People's Hospital et de l'Université de l'Illinois à Urbana-Champaign, publient le 29 mai 2026 dans npj Digital Medicine Pathog-PDx, un système d'apprentissage automatique (machine learning : famille de techniques où le modèle apprend une règle de décision à partir d'exemples étiquetés) qui combine 42 variables cliniques et biologiques tirées du dossier patient informatisé pour distinguer 22 sous-types de pathogènes responsables d'infections respiratoires chez l'enfant hospitalisé. Cohorte de développement de 134 500 enfants à travers trois centres cliniques et deux bases de données, validation prospective indépendante sur 1 338 enfants, AUC moyenne (aire sous la courbe ROC, mesure de discrimination entre cas positifs et négatifs comprise entre 0,5 et 1,0) de 0,88 sur les 22 pathogènes, 0,95 pour le virus de la grippe avec sensibilité 0,88 et spécificité 0,86, gestion explicite des co-infections, déploiement en ligne d'un système d'aide à la décision. Quatre réserves toutefois : tous les centres de développement sont chinois, le comparateur clinique humain est absent du résumé, la licence CC BY-NC-ND ferme l'adaptation académique, et le gold standard utilisé pour étiqueter 22 classes mérite d'être discuté à part — biologie moléculaire de précision variable selon les pathogènes.
Le contexte
Les infections respiratoires aiguës sont la première cause de morbidité pédiatrique dans le monde et la deuxième cause de mortalité infantile sous l'âge de cinq ans selon l'OMS. À l'admission d'un enfant fiévreux et symptomatique, la décision thérapeutique dépend du pathogène en cause : antibiotique pour un Streptococcus pneumoniae ou un Mycoplasma pneumoniae, antiviral ciblé pour le virus de la grippe ou le SARS-CoV-2, simple soutien pour un virus respiratoire syncytial (VRS) ou un rhinovirus banal. Le clinicien décide en pratique avant d'avoir le résultat des examens : la PCR multiplex et la culture mettent généralement entre 6 et 48 heures à rendre un résultat exploitable, alors que la fenêtre d'efficacité d'un oseltamivir contre la grippe se referme idéalement dans les 48 premières heures. C'est cet écart entre décision et diagnostic que vise Pathog-PDx.
Les approches antérieures se sont concentrées sur un ou quelques pathogènes — typiquement des modèles binaires entraînés à reconnaître une bronchiolite à VRS, une pneumonie à pneumocoque ou un Covid-19 — à partir de variables cliniques au lit du patient ou d'images radiologiques. Le passage à 22 sous-types de pathogènes simultanément, avec gestion explicite des co-infections (un même enfant pouvant héberger simultanément deux ou trois agents), est en revanche très récent et reste rare dans la littérature publiée. Le pari de Pathog-PDx est qu'un signal stable, multi-organe, intégré à partir du dossier électronique (EHR pour electronic health record) — numération-formule sanguine, marqueurs inflammatoires, ionogramme, signes cliniques codés, comorbidités — porte assez d'information pour pré-orienter le diagnostic, avant que les tests biologiques spécifiques ne tranchent.
La méthode
L'étude est dirigée par Wanshan Ning (Institute for Clinical Medical Research, First Affiliated Hospital of Xiamen University), avec comme co-auteurs correspondants Yungang Yang (Département de pédiatrie, même institution), Yaping Guo (École de médecine fondamentale, Zhengzhou University) et Jingjing Yang (Pneumologie et réanimation, Xiamen). Les coauteurs partagent onze affiliations principalement chinoises (Xiamen, Nanjing, Zhengzhou, Shenzhen, Children's Hospital of Fudan University - Xiamen Branch) plus une affiliation à la Siebel School of Computing and Data Science de l'University of Illinois Urbana-Champaign (Jiajun Fan). Article publié le 29 mai 2026 dans npj Digital Medicine, DOI 10.1038/s41746-026-02818-9, sous licence CC BY-NC-ND 4.0 (non-commercial, no derivatives) — point sur lequel nous revenons. Financements publics chinois exclusivement (National Key R&D Program of China 2021ZD0201300 et 2022YFC2704300, NSFC 32400532 et 32570802, programmes Fujian, Henan et Xiamen). Les auteurs déclarent no competing interests. Le manuscrit est diffusé en version « non éditée » (Article in Press), donc susceptible d'évoluer.
Le système se nomme Pathog-PDx (Pathogen Diagnostic System for Pediatric Respiratory Infections). Il prend en entrée 42 variables tirées du dossier électronique — démographie de l'enfant, signes cliniques codés au moment de l'admission, antécédents et comorbidités, résultats de la numération-formule sanguine et de panels biochimiques de routine, marqueurs inflammatoires (probablement CRP, procalcitonine) — et produit en sortie une probabilité pour chacune des 22 classes de pathogènes, ainsi qu'une probabilité conjointe pour les co-infections. Les auteurs revendiquent une architecture interprétable : sans le manuscrit complet, on peut raisonnablement supposer qu'il s'agit d'un gradient boosting (XGBoost ou LightGBM) couplé à une explication par valeurs de Shapley (SHAP), schéma désormais standard pour les modèles tabulaires en santé. Les comparateurs cités sont des « modèles conventionnels » — vraisemblablement régression logistique multinomiale, random forest et un baseline issu de règles cliniques.
Le jeu de données de développement couvre 134 500 enfants hospitalisés, agrégés à partir de trois centres cliniques chinois et de deux bases de données. Le jeu de validation prospective indépendante porte sur 1 338 enfants issus d'un quatrième établissement — point méthodologique fort, parce que cette cohorte n'a pas été vue par le modèle pendant l'entraînement et qu'elle est collectée après gel du modèle. Le gold standard utilisé pour étiqueter les 22 pathogènes n'est pas extrait du résumé mais combine vraisemblablement, selon les pratiques chinoises actuelles, PCR multiplex respiratoire, culture bactérienne et sérologie selon l'agent — un mélange dont la sensibilité analytique varie significativement d'un pathogène à l'autre.
Les résultats
Sur la cohorte de validation prospective, Pathog-PDx atteint une AUC moyenne de 0,88 sur les 22 pathogènes. Sur le virus de la grippe pris comme exemple d'application clinique courante, l'AUC est de 0,95, la sensibilité de 0,88 et la spécificité de 0,86. Les auteurs affirment que le modèle dépasse les approches conventionnelles à la fois sur les infections simples et sur les co-infections — qui sont la difficulté principale en pratique pédiatrique, où un VRS et une surinfection bactérienne cohabitent fréquemment. Le système a été déployé comme service web public à l'adresse pathogpdx.zzu.edu.cn, hébergé sur les serveurs de Zhengzhou University, et fournit pour chaque cas une prédiction « avant les résultats de tests conventionnels » avec un objectif explicite de pré-orientation thérapeutique.
Traduction clinique. Pour fixer les idées sur 1 000 enfants admis avec un syndrome respiratoire fébrile dont environ 100 souffrent réellement d'une grippe (prévalence typique en saison épidémique en Asie de l'Est) : aux performances annoncées pour la grippe, le modèle détecterait correctement 88 des 100 grippes vraies (12 faux négatifs), au prix de 126 faux positifs grippe parmi les 900 non-grippes (sensibilité 0,88, spécificité 0,86). Sur l'ensemble des 22 classes, une AUC moyenne de 0,88 indique une bonne discrimination globale mais masque presque certainement une variabilité importante entre pathogènes : les agents rares ou aux signatures biologiques peu spécifiques (adénovirus, parainfluenza de type 4, certains coronavirus saisonniers) sont vraisemblablement moins bien classés que la grippe ou le pneumocoque. Pour un service de pédiatrie qui gère un afflux saisonnier, l'outil ne remplace ni la PCR multiplex ni le jugement clinique, mais il peut crédiblement orienter la prescription empirique d'un oseltamivir ou la décision de placer un enfant en isolement respiratoire en attendant la confirmation biologique.
Ce qui est bien
La validation prospective indépendante existe vraiment, et c'est rare. La plupart des modèles ML cliniques publiés dans cette zone se contentent d'une validation interne par cross-validation ou d'une validation rétrospective sur un site externe. Ici, 1 338 enfants ont été inclus de façon prospective dans une cohorte spécifiquement constituée pour évaluer le modèle après son entraînement — le modèle a donc dû classer des patients qu'il n'avait jamais vus, dans une période postérieure à la collecte de la cohorte de développement. C'est la procédure d'évaluation la plus exigeante avant un essai contrôlé randomisé. À cela s'ajoute le déploiement public d'un service web fonctionnel : la transposition « du papier au prototype utilisable » est concrètement franchie, ce qui reste minoritaire dans la littérature ML-santé.
L'ambition multi-classes avec gestion des co-infections attaque un vrai problème clinique. Les modèles binaires « VRS oui/non » publiés en série depuis dix ans n'aident pas le clinicien qui doit hiérarchiser le risque entre VRS, grippe, métapneumovirus, pneumocoque et Mycoplasma chez le même enfant. Un modèle qui produit en sortie une probabilité conjointe sur 22 classes et qui traite explicitement les co-infections change l'utilité pratique : le clinicien obtient un tableau de probabilités hiérarchisées qui correspond à la manière dont il raisonne réellement. Cette discipline d'étiquetage et d'évaluation multi-classes est techniquement plus difficile que les approches binaires et mérite d'être saluée.
Les variables d'entrée sont disponibles partout. Les 42 variables intégrées par Pathog-PDx sont des données de routine du dossier électronique : démographie, signes cliniques codés, hémogramme, CRP, biochimie standard. Aucune n'exige une imagerie spécialisée, une biopsie ou un panel moléculaire coûteux. Cela signifie qu'à condition de réviser le calibrage et de revalider sur d'autres populations, le modèle est en principe transposable à un hôpital universitaire européen ou nord-américain — voire à des centres à ressources plus limitées qui disposent du minimum d'examens biologiques standard. Le choix des variables est donc cohérent avec une ambition de généralisation, même si cette généralisation reste à démontrer.
Ce qui est moins bien
Tous les centres de développement sont chinois — biais de population évident. Les trois centres cliniques et les deux bases de données qui forment les 134 500 enfants d'entraînement sont chinois (Xiamen, Zhengzhou, Shenzhen, Children's Hospital of Fudan University - Xiamen Branch). L'épidémiologie respiratoire pédiatrique varie significativement d'un continent à l'autre : la prévalence du Mycoplasma pneumoniae a connu en Chine une vague exceptionnelle en 2023-2024 qui a déplacé les distributions de classes, le ratio bactéries/virus dépend de la couverture vaccinale (PCV13, ROR, antigrippal) et donc du système de santé, et certains pathogènes endémiques régionaux (typiquement le métapneumovirus aviaire ou certains coronavirus saisonniers) sont sur-représentés dans certains pays. Le mode d'échec ici est le biais de population classique : le modèle apprend une distribution conditionnelle « signes cliniques + biologie → pathogène » qui n'est pas universelle. La preuve qu'il fonctionne sur un enfant fiévreux de Marseille, Boston ou Nairobi demanderait une validation externe non chinoise — absente ici.
Le comparateur humain est absent du résumé. Pathog-PDx est comparé à des « modèles conventionnels » — vraisemblablement régression logistique multinomiale et random forest — qu'il dépasse. La vraie question clinique est différente : un pédiatre senior d'unité d'hospitalisation atteint-il, avec les mêmes 42 variables, une discrimination équivalente ? Un infectiologue pédiatrique consulté en sus ? Sans cette référence humaine, les chiffres présentés flatteront l'outil au regard de baselines algorithmiques mais ne permettent pas de décider si la pré-orientation par Pathog-PDx apporte une valeur incrémentale au-dessus du jugement clinique courant. C'est le mode d'échec comparateur biaisé par omission : la baseline la plus pertinente — un clinicien expérimenté avec les mêmes données — est invisible. À cela s'ajoute le silence du résumé sur la performance par classe : une AUC moyenne de 0,88 sur 22 pathogènes signifie presque mécaniquement qu'au moins quelques sous-types tombent sous 0,75, et identifier lesquels (probablement les agents rares ou aux signatures biologiques peu spécifiques) est déterminant pour décider à quoi se fier en pratique.
La licence CC BY-NC-ND ferme l'adaptation académique et masque une question de gold standard. Le manuscrit est publié sous CC BY-NC-ND 4.0 — pas la CC BY 4.0 standard de l'open access Nature. Le NC interdit tout usage commercial (légitime) ; le ND interdit toute œuvre dérivée, ce qui complique l'adaptation académique du code, des poids, ou même des figures pour une réplication ou une transposition à un autre contexte. À cela s'ajoute une question méthodologique de fond : le gold standard utilisé pour étiqueter les 22 classes n'est pas détaillé dans le résumé. Or la sensibilité analytique d'une PCR multiplex respiratoire varie selon le pathogène (excellente pour la grippe, plus faible pour Mycoplasma), la culture bactérienne sous-estime systématiquement les agents fragiles, et la sérologie tardive ne couvre que rétrospectivement certains diagnostics. Si certaines classes sont étiquetées avec un standard moins fiable, c'est du bruit d'étiquette (label noise) injecté en entraînement, qui peut soit dégrader la performance de l'agent concerné, soit — pire — créer une illusion de bonne classification en faisant apprendre au modèle la signature biologique du test plutôt que celle du pathogène. Sans extraction de ces détails du manuscrit complet, c'est un mode d'échec shortcut learning qui reste à exclure formellement.
Ce que ça change
Pour la communauté de recherche en IA-santé, Pathog-PDx s'inscrit dans une vague récente qui revient au tabulaire pour les questions de diagnostic différentiel, après plusieurs années d'investissement massif dans l'imagerie. Le mérite est de pousser le standard à 22 classes avec co-infections : on ne se satisfait plus d'un benchmark binaire VRS oui/non, on demande désormais un tableau hiérarchisé de pathogènes probables. Les groupes qui travaillent sur des problématiques voisines — sepsis néonatal, septicémie aux urgences pédiatriques, diagnostic différentiel des méningites — trouveront ici un patron de pipeline (variables EHR de routine, validation prospective sur cohorte indépendante, déploiement en service web) qu'ils peuvent répliquer. Reste à voir une réplication par une équipe européenne ou nord-américaine sur leurs propres données, qui dira si le signal est portable ou s'il était spécifique à l'épidémiologie respiratoire chinoise de la période d'entraînement.
Pour les cliniciens pédiatres, l'usage immédiat crédible n'est pas le remplacement de la PCR multiplex mais la pré-orientation thérapeutique dans les premières heures d'hospitalisation — moment où le clinicien décide d'administrer ou non un oseltamivir, d'isoler ou non un enfant à VRS, de couvrir empiriquement ou non une co-infection bactérienne. Une AUC de 0,95 sur la grippe est un chiffre crédible pour ce cas d'usage. Sur d'autres classes, sans avoir le détail par pathogène, la prudence impose de considérer Pathog-PDx comme une aide à l'hypothèse, pas comme un diagnostic. Aucun système de ce type n'est aujourd'hui approuvé par la Haute Autorité de Santé en France, ni en CE-marqué comme Software as a Medical Device, ni autorisé par la FDA aux États-Unis. L'usage clinique réel hors de Chine demandera une revalidation locale et une certification réglementaire, qui ne sont pas l'objet de cet article.
Pour les patients et leurs familles, l'enseignement utile est que l'identification précoce du pathogène responsable d'une bronchiolite ou d'une pneumonie de l'enfant devient techniquement plus rapide grâce à des modèles qui exploitent les analyses de routine déjà disponibles à l'admission. Cela ne dispense en rien du parcours clinique : un enfant fiévreux qui s'aggrave doit être vu par un médecin, et la décision thérapeutique reste humaine. En attendant qu'un outil de ce type soit validé et certifié pour un usage hors de Chine, le bon réflexe reste l'usage prudent des antibiotiques (qui ne servent à rien sur les virus), la vaccination antigrippale annuelle des enfants à risque, et la vaccination contre le VRS désormais recommandée chez le nourrisson dans plusieurs pays européens.
Pour aller plus loin
L'article complet est en accès libre sur le site de npj Digital Medicine : nature.com/articles/s41746-026-02818-9. Le système d'aide à la décision déployé par les auteurs est consultable à pathogpdx.zzu.edu.cn (hébergé à Zhengzhou University). Pour le cadre OMS de la prise en charge des infections respiratoires de l'enfant : WHO Pocket Book of Hospital Care for Children. Pour notre couverture d'autres applications du machine learning à la décision médicale à partir du dossier électronique, voir notre décryptage du modèle SHAP-SVM de Zhou 2026 pour la prédiction de la thrombo-embolie veineuse en oncologie et notre décryptage du pipeline Brzus 2026 de neuroimagerie pronostique post-AVC.