Cinq outils MCP qui voient une grossesse comme une seule unité clinique

Lauréat d'Agents Assemble : The Healthcare AI Endgame de Prompt Opinion, parmi 4 335 participants. La mortalité maternelle aux États-Unis ne cesse d'augmenter et plus de 80 % des décès liés à la grossesse sont évitables, mais les signaux prédictifs vivent dans des parties complètement différentes du dossier. J'ai construit un serveur MCP qui les agrège, et un agent de triage qui lui délègue.

FHIRMCPHealthcareA2AAward

Voir la démo Code source

Mise à jour : MaternalGuard a remporté Agents Assemble : The Healthcare AI Endgame de Prompt Opinion, un défi de 25 000 $ réunissant 4 335 participants, jugé sur la création d'agents de santé interopérables à la croisée de MCP, A2A et FHIR. Voici comment il fonctionne.

La mortalité maternelle aux États-Unis ne cesse d'augmenter. Plus de 80 % des décès liés à la grossesse sont évitables selon les CDC, mais les signaux qui les prédisent, TA qui monte, plaquettes qui baissent, ASAT élevée, protéinurie qui s'aggrave, obstacles de transport, insécurité alimentaire, vivent dans des parties complètement différentes du dossier. Aucun clinicien isolé ne les voit agrégés en une seule vue, et les alertes basées sur des règles dans les DME ne se déclenchent pas sur des constellations de données.

L'aval pédiatrique est aussi ignoré. Chaque admission en USIN due à la prééclampsie, chaque bébé macrosome né d'une mère atteinte de diabète gestationnel, c'est un coût de 25 000 $+ que les soins prénataux ne facturent pas actuellement. Je voulais tester si donner à un LLM la bonne tranche structurée de FHIR lui permettrait de faire le pattern matching mère-bébé qu'une obstétricienne occupée ne peut pas toujours faire dans les 15 minutes avant une consultation prénatale.

Diagramme d'architecture de bout en bout de MaternalGuard — Architecture de bout en bout, clinicien, agent orchestrateur, agent spécialiste, outils MCP, magasin FHIR R4.

Cinq outils, un serveur, FHIR R4

MaternalGuard est un serveur Model Context Protocol doté de 5 outils qui lisent les données FHIR R4 d'une patiente enceinte et renvoient un contexte prêt à décider à l'IA de la plateforme Prompt Opinion :

AssessMaternalRisk, démographie, affections, signes vitaux récents, analyses, médicaments, avec marqueurs CIM-10 à haut risque et références ACOG Practice Bulletin.
InterpretLabTrends, relevés longitudinaux d'analyses et de signes vitaux regroupés par code LOINC avec plages de référence spécifiques à la grossesse.
ScreenSocialDeterminants, assurance, langue, adresse, observations d'histoire sociale, obstacles signalés.
GenerateCarePlan, affections, allergies, médicaments, plans de soins existants, plus recommandations de dépistage alignées sur l'ACOG.
PredictNeonatalImpact, projette les conséquences néonatales à partir des données maternelles avec une checklist néonatale stratifiée par âge gestationnel.

L'agent Prenatal Visit Prep appelant les cinq outils MCP de MaternalGuard dans l'ordre — Les 5 outils MCP s'exécutent dans l'ordre sur une seule exécution de Prenatal Visit Prep : AssessMaternalRisk, InterpretLabTrends, ScreenSocialDeterminants, GenerateCarePlan, PredictNeonatalImpact.

Composition d'agents à deux niveaux

Deux agents composés démontrent la thèse « Agents Assemble ». Prenatal Visit Prep orchestre les 5 outils MaternalGuard et récupère depuis une Collection ancrée de lignes directrices cliniques (NICE NG133, USPSTF, CDC, IADPSG, OMS) pour produire une note de pré-consultation consolidée en 6 sections. Chaque affirmation est citée avec valeurs, dates, codes LOINC et numéros de Practice Bulletins ACOG ; les affirmations ancrées citent directement les PDF de la Collection.

On-Call OB Triage est un Orchestrator Agent Prompt Opinion sans outils MCP propres. Il délègue en A2A à Prenatal Visit Prep pour le triage de symptômes aigus et convertit la note retournée en une décision de triage (RÉASSURANCE, VISITE AU CABINET, ÉVALUATION L&D ou URGENCE) plus un résumé patient dans la langue appropriée. Composition d'agents à deux niveaux entièrement sur standards ouverts, MCP, A2A, SHARP, FHIR R4, US Core.

Ce qui a cassé et pourquoi c'est important

Trois modes d'échec ressortent, parce que chacun est une leçon sur la santé pilotée par LLM dans la boucle :

Gestion des null dans Zod. Le LLM de la plateforme passait explicitement "patientId": null dans les arguments des outils au lieu d'omettre le champ, ce qui provoquait des erreurs de validation sur z.string().optional(). Corrigé en ajoutant .nullable() à chaque paramètre optionnel des 5 outils.
Passage de l'âge gestationnel. Le LLM passait null pour gestationalAgeWeeks à GenerateCarePlan, ce qui faisait s'effondrer les recommandations de dépistage ACOG. Corrigé par une règle du prompt système lui disant de calculer la valeur à partir du code Z34.XX ou de onsetDateTime.
Câblage de la récupération vectorielle. Après avoir attaché la Collection, la récupération ne se déclenchait pas. Les tokens d'entrée restaient minuscules et le LLM hallucinait des passages cités. La cause profonde était un bouton « Disable Embedded Tools » qui bloquait l'outil de récupération SearchSources de la plateforme. Le réactiver, plus des règles explicites du prompt interdisant son mauvais usage, ont restauré la récupération.

La sécurité doit être structurelle

J'ai essayé de demander au LLM d'« être prudent » et ça fonctionnait de manière inconstante. Exiger des citations à chaque affirmation, terminer chaque note par « Revue clinicienne requise avant toute action », et ajouter un garde-fou au niveau plateforme qui valide chaque réponse avant qu'elle n'arrive à l'utilisateur, ça fait passer la sécurité d'un ressenti à une architecture.

Ce que l'agent réussit

Reconnaissance de motifs multi-signaux de bout en bout. L'agent identifie correctement la progression du HELLP sur le dossier synthétique de Maria Santos à partir de la combinaison TA en hausse, ASAT en hausse, plaquettes en baisse, protéinurie en hausse et acide urique élevé. Une constellation qu'aucun moteur de règles à métrique unique ne déclencherait.

Recommandations conscientes des allergies. La prophylaxie SGB à 36 semaines signale automatiquement l'allergie à la pénicilline de la patiente et recommande des alternatives (céfazoline pour faible sévérité, clindamycine ou vancomycine pour anaphylaxie) selon ACOG PB #797. Communication patient indépendante de la langue, la décision de triage on-call produit un résumé patient d'une phrase dans la langue préférée du patient avec la bonne terminologie clinique (par exemple, « sala de labor y parto » pour L&D en espagnol, jamais le faux-ami « laboratorio »).

La suite

Continuité post-partum, étendre l'ensemble d'outils pour couvrir la fenêtre de 12 semaines post-partum, où survient plus d'un tiers des décès liés à la grossesse. Vraie intégration FHIR contre des bacs à sable Epic et Cerner en direct. Un agent compagnon NeonatalPrep qui s'abonne à la sortie de PredictNeonatalImpact et coordonne avec des agents USIN, L&D et anesthésie via A2A. L'économie unitaire suggère un seuil de rentabilité face à une admission en USIN évitée (25 k$+) à environ 300 k notes.

Projet associé

MaternalGuard: Mother-Baby FHIR Risk Brief via MCP

Voir le projet

Article précédent

Là où les marchés de prédiction échouent systématiquement

19 858 marchés Polymarket résolus. Un biais de formulation structurel de 32 points. Un calibrateur isotonique qui bat le marché brut sur le Brier d'un ordre de grandeur, en hors-échantillon. Et un scanner en direct par-dessus.

Mai 20267 min de lecture

Article suivant

Livrer un site bilingue qu'une équipe québécoise peut s'approprier

Les acheteurs de toitures et de solaire ne lisent pas une page de vente de manière linéaire. Ils scannent pour trouver des signaux de confiance, des heures, et « est-ce que cette personne connaît mon type de toit ? ». La construction AL Pro est ajustée pour ça, bilingue, scannable et durcie SEO contre les audits IA.

Fév. 2026 à aujourd'hui6 min de lecture

FHIR + CDS Hooks + Gemini : un score de risque qu'un clinicien lira vraiment

Les scores de risque meurent quand ils sont des boîtes noires. L'intégration MeldRx via FHIR/CDS Hooks tire les données patient ; Gemini Flash renvoie du JSON structuré avec explications, confiance et actions recommandées ; l'UI livre aux cliniciens un rapport PDF téléchargeable.