Skip to main content
Jonathan Andrei
Retour aux billets
Avr. 2026 à Mai 202610 min de lecture

Cinq outils MCP qui voient une grossesse comme une seule unité clinique

La mortalité maternelle aux États-Unis ne cesse d'augmenter, et plus de 80 % des décès liés à la grossesse sont évitables. Les signaux prédictifs vivent dans des parties complètement différentes du dossier. J'ai construit un serveur MCP qui les agrège — et un agent de triage qui lui délègue.

FHIRMCPHealthcareA2AClinical AI

La mortalité maternelle aux États-Unis ne cesse d'augmenter. Plus de 80 % des décès liés à la grossesse sont évitables selon les CDC, mais les signaux qui les prédisent — TA qui monte, plaquettes qui baissent, ASAT élevée, protéinurie qui s'aggrave, obstacles de transport, insécurité alimentaire — vivent dans des parties complètement différentes du dossier. Aucun clinicien isolé ne les voit agrégés en une seule vue, et les alertes basées sur des règles dans les DME ne se déclenchent pas sur des constellations de données.

L'aval pédiatrique est aussi ignoré. Chaque admission en USIN due à la prééclampsie, chaque bébé macrosome né d'une mère atteinte de diabète gestationnel, c'est un coût de 25 000 $+ que les soins prénataux ne facturent pas actuellement. Je voulais tester si donner à un LLM la bonne tranche structurée de FHIR lui permettrait de faire le pattern matching mère-bébé qu'une obstétricienne occupée ne peut pas toujours faire dans les 15 minutes avant une consultation prénatale.

Diagramme d'architecture de bout en bout de MaternalGuard
Architecture de bout en bout — clinicien, agent orchestrateur, agent spécialiste, outils MCP, magasin FHIR R4.

Cinq outils, un serveur, FHIR R4

MaternalGuard est un serveur Model Context Protocol doté de 5 outils qui lisent les données FHIR R4 d'une patiente enceinte et renvoient un contexte prêt à décider à l'IA de la plateforme Prompt Opinion :

  • AssessMaternalRisk — démographie, affections, signes vitaux récents, analyses, médicaments, avec marqueurs CIM-10 à haut risque et références ACOG Practice Bulletin.
  • InterpretLabTrends — relevés longitudinaux d'analyses et de signes vitaux regroupés par code LOINC avec plages de référence spécifiques à la grossesse.
  • ScreenSocialDeterminants — assurance, langue, adresse, observations d'histoire sociale, obstacles signalés.
  • GenerateCarePlan — affections, allergies, médicaments, plans de soins existants, plus recommandations de dépistage alignées sur l'ACOG.
  • PredictNeonatalImpact — projette les conséquences néonatales à partir des données maternelles avec une checklist néonatale stratifiée par âge gestationnel.
Liste des appels d'outils de Prenatal Visit Prep
Les 5 outils MCP s'exécutent dans l'ordre sur une seule exécution de Prenatal Visit Prep.

Composition d'agents à deux niveaux

Deux agents composés démontrent la thèse « Agents Assemble ». Prenatal Visit Prep orchestre les 5 outils MaternalGuard et récupère depuis une Collection ancrée de lignes directrices cliniques (NICE NG133, USPSTF, CDC, IADPSG, OMS) pour produire une note de pré-consultation consolidée en 6 sections. Chaque affirmation est citée avec valeurs, dates, codes LOINC et numéros de Practice Bulletins ACOG ; les affirmations ancrées citent directement les PDF de la Collection.

On-Call OB Triage est un Orchestrator Agent Prompt Opinion sans outils MCP propres. Il délègue en A2A à Prenatal Visit Prep pour le triage de symptômes aigus et convertit la note retournée en une décision de triage (RÉASSURANCE, VISITE AU CABINET, ÉVALUATION L&D ou URGENCE) plus un résumé patient dans la langue appropriée. Composition d'agents à deux niveaux entièrement sur standards ouverts — MCP, A2A, SHARP, FHIR R4, US Core.

Ce qui a cassé et pourquoi c'est important

Trois modes d'échec ressortent, parce que chacun est une leçon sur la santé pilotée par LLM dans la boucle :

  • Gestion des null dans Zod. Le LLM de la plateforme passait explicitement "patientId": null dans les arguments des outils au lieu d'omettre le champ, ce qui provoquait des erreurs de validation sur z.string().optional(). Corrigé en ajoutant .nullable() à chaque paramètre optionnel des 5 outils.
  • Passage de l'âge gestationnel. Le LLM passait null pour gestationalAgeWeeks à GenerateCarePlan, ce qui faisait s'effondrer les recommandations de dépistage ACOG. Corrigé par une règle du prompt système lui disant de calculer la valeur à partir du code Z34.XX ou de onsetDateTime.
  • Câblage de la récupération vectorielle. Après avoir attaché la Collection, la récupération ne se déclenchait pas. Les tokens d'entrée restaient minuscules et le LLM hallucinait des passages cités. La cause profonde était un bouton « Disable Embedded Tools » qui bloquait l'outil de récupération SearchSources de la plateforme. Le réactiver, plus des règles explicites du prompt interdisant son mauvais usage, ont restauré la récupération.

La sécurité doit être structurelle

J'ai essayé de demander au LLM d'« être prudent » et ça fonctionnait de manière inconstante. Exiger des citations à chaque affirmation, terminer chaque note par « Revue clinicienne requise avant toute action », et ajouter un garde-fou au niveau plateforme qui valide chaque réponse avant qu'elle n'arrive à l'utilisateur — ça fait passer la sécurité d'un ressenti à une architecture.

Ce que l'agent réussit

Reconnaissance de motifs multi-signaux de bout en bout. L'agent identifie correctement la progression du HELLP sur le dossier synthétique de Maria Santos à partir de la combinaison TA en hausse, ASAT en hausse, plaquettes en baisse, protéinurie en hausse et acide urique élevé. Une constellation qu'aucun moteur de règles à métrique unique ne déclencherait.

Recommandations conscientes des allergies. La prophylaxie SGB à 36 semaines signale automatiquement l'allergie à la pénicilline de la patiente et recommande des alternatives (céfazoline pour faible sévérité, clindamycine ou vancomycine pour anaphylaxie) selon ACOG PB #797. Communication patient indépendante de la langue — la décision de triage on-call produit un résumé patient d'une phrase dans la langue préférée du patient avec la bonne terminologie clinique (par exemple, « sala de labor y parto » pour L&D en espagnol, jamais le faux-ami « laboratorio »).

La suite

Continuité post-partum — étendre l'ensemble d'outils pour couvrir la fenêtre de 12 semaines post-partum, où survient plus d'un tiers des décès liés à la grossesse. Vraie intégration FHIR contre des bacs à sable Epic et Cerner en direct. Un agent compagnon NeonatalPrep qui s'abonne à la sortie de PredictNeonatalImpact et coordonne avec des agents USIN, L&D et anesthésie via A2A. L'économie unitaire suggère un seuil de rentabilité face à une admission en USIN évitée (25 k$+) à environ 300 k notes.

Projet associé

MaternalGuard: Mother-Baby FHIR Risk Brief via MCP

Voir le projet